Anàlisi de Dades Experimentals
© Antoni Amengual Colom. Departament de Física, Universitat de les Illes Balears.
Versió 1.0 publicada al setembre de 2013. DL: PM 860-2013.
Test khi quadrat
Definició i propietats de la funció densitat de probabilitat khi quadrat
Introducció «
La funció densitat de probabilitat de la suma de m variables aleatòries gaussianes de mitjana zero i variància unitat s'anomena funció densitat de probabilitat khi quadrat per a m graus de llibertat.
El nom prové de la lletra grega khi, χ. La notació per a la funció és senzillament χ2, sense fer explícit el nombre de graus de llibertat.
La lletra khi s'usa en aquest context sempre escrita al quadrat. Dins l'Electromagnetisme, la lletra χ s'usa per identificar les susceptibilitats elèctrica i magnètica, les constants que caracteritzen la resposta d'un material quan està en un camp elèctric o magnètic extern. En aquest context, se sol escriure amb els subíndex e i m.
Definició «
Siguin Yi, i = 1..m, un conjunt de m variables aleatòries gaussianes independents de mitjana 0 i variància 1.
Sigui Xm la variable aleatòria definida com a suma dels quadrats d'aquestes m variables Yi,
Xm = Y12 + Y22 + ... + Ym2.
La funció densitat de probabilitat de cada una de les variables Yi és gaussiana. Per la seva banda, la funció densitat de probabilitat de la suma Xm és
on Γ(m/2) és el valor de la funció gamma per al semienter m/2.
Propietats
«
Es donen a continuació el valor esperat i la variància de la variable aleatòria Xm.
Valor esperat
«
El valor esperat de Xm és
El resultat de la integració dóna
E(Xm) = m
Variància
«
La variància de X és
El resultat de la integració dóna
V(Xm) = 2m
Gràfics i taules
«
Es donen a continuació taules i gràfics per a diferents graus de llibertat de les funcions densitat de probabilitat PXm(x) i distribució de probabilitat FXm(x).
Gràfics de la funció densitat de probabilitat per a m graus de llibertat
«
Es presenten les funcions densitat de probabilitat per a les variables X1, X2 i Xm amb m ≥ 3.
m = 1
«
La funció densitat de probabilitat de la variable definida positiva
X1 = Y12
és
la qual divergeix a l'origen i decreix monòtonament cap a zero. X1 és senzillament el quadrat d'una variable aleatòria gaussiana.
m = 2
«
La funció densitat de probabilitat de la variable definida positiva
X1 = Y12 + Y22
és
la qual val 0.5 a l'origen i decreix monòtonament cap a zero.
m ≥ 3
«
Les formes de les funcions densitat de probabilitat per a les variables Xm amb m ≥ 3, es mostren a la Fig. 1a. Les funcions valen 0 a l'origen, tenen un màxim i tendeixen a 0 per a x → ∞. La posició del màxim està més a la dreta com més gran és m. Posar x/m a l'eix d'abscisses (m és el nombre de graus de llibertat però també és el valor esperat de la variable aleatòria Xm) permet acostar les posicions dels màxims a la Fig. 1b.
Els fulls de càlcul tenen la funció DISTR.CHI(χ2; m) que dóna el valor de la funció densitat de probabilitat khi quadrat per a m graus de llibertat.
Figura 1. a) Funcions densitat de probabilitat per a diferents graus de llibertat a partir de tres. b) Les mateixes funcions dibuixades amb l'eix d'abscisses escalat segons el nombre de graus de llibertat que és també el valor esperat de la variable aleatòria.
Gràfics de la distribució de probabilitat per a m graus de llibertat
«
Figura 2. Distribucions de probabilitat per a diferents graus de llibertat amb l'eix d'abscisses escalat segons el valor esperat m.
La distribució de probabilitat es calcula amb la integral
Les corbes de les distribucions de probabilitat per a m des de 1 fins a 12 es mostren a la Fig. 2.
Taules i gràfics de la probabilitat que khi quadrat sigui més gran que un valor donat
«
Figura 3. L'àrea de color verd dóna la probabilitat que khi quadrat sigui més gran que el valor khi zero quadrat.
Per analitzar si l'histograma d'un conjunt de dades és compatible amb una determinada distribució de probabilitat teòrica, s'usa la probabilitat que χ2 sigui més gran que un valor donat χ02. Tal probabilitat està representada per l'àrea de color verd a la Fig. 3. Aquesta probabilitat,
es calcula amb la integral
Les probabilitats en tant per cent per a diferents graus de llibertat se solen donar en forma de taula com les incloses a continuació per a conjunts des d'un grau de llibertat fins a 30 (marcau sobre » per desplegar les taules).
Taules de probabilitats »
La informació de les taules per a un conjunt de punts seleccionats es presenten sobre les representacions gràfiques a la figura 3.
Figura 4. Probabilitat que χ-quadrat sigui més gran que un valor donat segons el nombre de graus de llibertat m = g.
Taules dels valors de probabilitat 5 % i 1 %
«
Quan no sigui necessari conèixer el valor exacte de la probabilitat
sinó que basti saber si és més gran que el 5 % o l'1 %, és suficient comparar χ2 amb els valors λ5 i λ1 per als quals
Pr(χ2 ≥ λ5) = 0.05,
Pr(χ2 ≥ λ1) = 0.01.
Els valors de λ5 i λ1 s'usaran per determinar si la discrepància entre els valors observats en un histograma i els esperats és significativa o molt significativa, respectivament.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
3.84 | 5.99 | 7.81 | 9.49 | 11.1 | 12.6 | 14.1 | 15.5 | 16.9 | 18.3 | |
6.63 | 9.21 | 11.3 | 13.3 | 15.1 | 16.8 | 18.5 | 20.1 | 21.7 | 23.2 | |
11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | |
19.7 | 21.0 | 22.4 | 23.7 | 25.0 | 26.3 | 27.6 | 28.9 | 30.1 | 31.4 | |
24.7 | 26.2 | 27.7 | 29.1 | 30.6 | 32.0 | 33.4 | 34.8 | 36.2 | 37.6 | |
21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | |
32.7 | 33.9 | 35.2 | 36.4 | 37.7 | 38.9 | 40.1 | 41.3 | 42.6 | 43.8 | |
38.9 | 40.3 | 41.6 | 43. | 44.3 | 45.6 | 47.0 | 48.3 | 49.6 | 50.9 | |
31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | |
45.0 | 46.2 | 47.4 | 48.6 | 49.8 | 51.0 | 52.2 | 53.4 | 54.6 | 55.8 | |
52.2 | 53.5 | 54.8 | 56.1 | 57.3 | 58.6 | 59.9 | 61.2 | 62.4 | 63.7 |
Taula 1. Valors de les variables λ5 i λ1 definides en el text en funció del nombre de graus de llibertat.