Anàlisi de Dades Experimentals
© Antoni Amengual Colom. Departament de Física, Universitat de les Illes Balears.

Versió 1.0 publicada al setembre de 2013. DL: PM 860-2013.

Test khi quadrat

Definició i propietats de la funció densitat de probabilitat khi quadrat

Introducció «

La funció densitat de probabilitat de la suma de m variables aleatòries gaussianes de mitjana zero i variància unitat s'anomena funció densitat de probabilitat khi quadrat per a m graus de llibertat.

El nom prové de la lletra grega khi, χ. La notació per a la funció és senzillament χ2, sense fer explícit el nombre de graus de llibertat.

La lletra khi s'usa en aquest context sempre escrita al quadrat. Dins l'Electromagnetisme, la lletra χ s'usa per identificar les susceptibilitats elèctrica i magnètica, les constants que caracteritzen la resposta d'un material quan està en un camp elèctric o magnètic extern. En aquest context, se sol escriure amb els subíndex e i m.

Definició «

Siguin Yi, i = 1..m, un conjunt de m variables aleatòries gaussianes independents de mitjana 0 i variància 1.

Sigui Xm la variable aleatòria definida com a suma dels quadrats d'aquestes m variables Yi,

Xm = Y12 + Y22 + ... + Ym2.   

La funció densitat de probabilitat de cada una de les variables Yi és gaussiana. Per la seva banda, la funció densitat de probabilitat de la suma Xm és

"ade_1.gif"

on Γ(m/2) és el valor de la funció gamma per al semienter m/2.

Propietats «

Es donen a continuació el valor esperat i la variància de la variable aleatòria Xm.

Valor esperat «

El valor esperat de Xm és

"ade_2.gif"

El resultat de la integració dóna

E(Xm) = m

Variància «

La variància de X és

"ade_3.gif"

El resultat de la integració dóna

V(Xm) = 2m

Gràfics i taules «

Es donen a continuació taules i gràfics per a diferents graus de llibertat de les funcions densitat de probabilitat PXm(x) i distribució de probabilitat FXm(x).

Gràfics de la funció densitat de probabilitat per a m graus de llibertat «

Es presenten les funcions densitat de probabilitat per a les variables X1, X2 i Xm amb m ≥ 3.

m = 1 «

La funció densitat de probabilitat de la variable definida positiva

X1 = Y12   

és

"ade_4.gif"

la qual divergeix a l'origen i decreix monòtonament cap a zero. X1 és senzillament el quadrat d'una variable aleatòria gaussiana.

m = 2 «

La funció densitat de probabilitat de la variable definida positiva

X1 = Y12 + Y22

és

"ade_5.gif"

la qual val 0.5 a l'origen i decreix monòtonament cap a zero.

m ≥ 3 «

Les formes de les funcions densitat de probabilitat per a les variables Xm amb m ≥ 3, es mostren a la Fig. 1a. Les funcions valen 0 a l'origen, tenen un màxim i tendeixen a 0 per a x → ∞. La posició del màxim està més a la dreta com més gran és m. Posar x/m a l'eix d'abscisses (m és el nombre de graus de llibertat però també és el valor esperat de la variable aleatòria Xm) permet acostar les posicions dels màxims a la Fig. 1b.

Els fulls de càlcul tenen la funció DISTR.CHI(χ2; m) que dóna el valor de la funció densitat de probabilitat khi quadrat per a m graus de llibertat.

"ade_6.gif"

"ade_7.gif"

Figura 1. a) Funcions densitat de probabilitat per a diferents graus de llibertat a partir de tres. b) Les mateixes funcions dibuixades amb l'eix d'abscisses escalat segons el nombre de graus de llibertat que és també el valor esperat de la variable aleatòria.

Gràfics de la distribució de probabilitat per a m graus de llibertat «

"ade_8.gif"

Figura 2. Distribucions de probabilitat per a diferents graus de llibertat amb l'eix d'abscisses escalat segons el valor esperat m.

La distribució de probabilitat es calcula amb la integral

"ade_9.gif"

Les corbes de les distribucions de probabilitat per a m des de 1 fins a 12 es mostren a la Fig. 2.

Taules i gràfics de la probabilitat que khi quadrat sigui més gran que un valor donat «

"ade_10.gif"

Figura 3. L'àrea de color verd dóna la probabilitat que khi quadrat sigui més gran que el valor khi zero quadrat.

Per analitzar si l'histograma d'un conjunt de dades és compatible amb una determinada distribució de probabilitat teòrica, s'usa la probabilitat que χ2 sigui més gran que un valor donat χ02. Tal probabilitat està representada per l'àrea de color verd a la Fig. 3. Aquesta probabilitat,

"ade_11.gif"

es calcula amb la integral

"ade_12.gif"

Les probabilitats en tant per cent per a diferents graus de llibertat se solen donar en forma de taula com les incloses a continuació per a conjunts des d'un grau de llibertat fins a 30 (marcau sobre » per desplegar les taules).

Taules de probabilitats »


La informació de les taules per a un conjunt de punts seleccionats es presenten sobre les representacions gràfiques a la figura 3.




Figura 4. Probabilitat que χ-quadrat sigui més gran que un valor donat segons el nombre de graus de llibertat m = g.

Taules dels valors de probabilitat 5 % i 1 % «

Quan no sigui necessari conèixer el valor exacte de la probabilitat

"ade_13.gif"

sinó que basti saber si és més gran que el 5 % o l'1 %, és suficient comparar χ2 amb els valors λ5 i λ1 per als quals

Pr(χ2λ5) = 0.05,

Pr(χ2λ1) = 0.01.

Els valors de λ5 i λ1 s'usaran per determinar si la discrepància entre els valors observats en un histograma i els esperats és significativa o molt significativa, respectivament.

"ade_14.gif"

m12345678910
λ53.845.997.819.4911.112.614.115.516.918.3
λ16.639.2111.313.315.116.818.520.121.723.2
m11121314151617181920
λ519.721.022.423.725.026.327.628.930.131.4
λ124.726.227.729.130.632.033.434.836.237.6
m21222324252627282930
λ532.733.935.236.437.738.940.141.342.643.8
λ138.940.341.643.44.345.647.048.349.650.9
m31323334353637383940
λ545.046.247.448.649.851.052.253.454.655.8
λ152.253.554.856.157.358.659.961.262.463.7

Taula 1. Valors de les variables λ5 i λ1 definides en el text en funció del nombre de graus de llibertat.