Anàlisi de Dades Experimentals
© Antoni Amengual Colom. Departament de Física, Universitat de les Illes Balears.

Versió 1.0 publicada al setembre de 2013. DL: PM 860-2013.

Teoria de la probabilitat

Estimador estadístic i biaix

Introducció «

En un tema següent es presentaran les funcions densitat de probabilitat gaussianas definides per dos paràmetres μ i σ, que són la mitjana i la variància poblacional de la variable aleatoris gaussiana considerada. A partir d'una llista de valors Ln d'una variable aleatòria gaussiana se poden cercar els paràmetres de la funció gaussiana de manera que la probabilitat de tenir els valors de la llista sigui màxima. Es troba

"ade_1.gif"

"ade_2.gif"

Com que aquests valors es calculen a partir d'una llista, la mitjana i el sumatori dividit per n són estimadors estadístics de la mitjana i la variància poblacional, respectivament.

Definit un estimador estadístic, el primer que s'ha de determinar és si el valor esperat de l'estimador és igual o no al paràmetre corresponent. Si és igual, es dirà que l'estimador no té biaix.

L'estimador estadístic i el concepte de biaix s'introdueixen en aquest tema per justificar perquè la variància de la mostra sx2, com a estimador estadístic de la variància σ2 es defineix amb l'expressió

"ade_3.gif"

on el sumatori es divideix per n – 1 en lloc de dividir-se per n com es fa amb la variància. Amb aquest canvi de divisor s'aconsegueix que l'estimador tengui el valor esperat igual que la variància poblacional.

Definició «

Un estimador estadístic és un valor calculat a partir d'una mostra per descriure una propietat desconeguda de la població Ω.

La mitjana d'una mostra és un estimador de la mitjana poblacional. Una propietat θ indeterminada de la població pot tenir més d'un estimador estadístic (cal notar que al canviar la mida de la mostra, l'estimador estrictament ja és diferent). De manera genèrica, l'estimador de la propietat θp s'escriu "ade_4.gif".

Sigui "ade_5.gif" un estimador estadístic d'un paràmetre de valor θp d'alguna propietat lligada a una variable aleatòria d'espai mostral Ω. El biaix de l'estimador estadístic és

"ade_6.gif"

Si el biaix d'un estimador estadístic és nul, es diu que l'estimador no té biaix.

Exemples «

Es donen a continuació tres estimadors estadístics. El primer i el tercer no tenen biaix, el segon, sí.

Mitjana d'una mostra «

La mitjana d'una mostra Ln,

"ade_7.gif"

és un estimador estadístic sense biaix de la mitjana poblacional E(X) perquè E(M) = E(X). La demostració ja es va donar a la pàgina sobre valors esperats.

Variança amb biaix d'una mostra «

Es considera ara l'estimador estadístic

"ade_8.gif"

Tenir una llista de valors Ln = {x1, x2, x3, ..., xn} és com tenir un valor per a cada una de n variables aleatòries definides amb la mateixa distribució de probabilitat. Llavors,

"ade_9.gif"

Se suma i resta E(X) = μ:

"ade_10.gif"

Es desenvolupa el quadrat mantenint els dos termes dels requadres de color agrupats,

"ade_11.gif"

El sumatori de la suma és la suma de sumatoris. S'extreuen els termes que no depenen de l'índex de suma i se sumen els termes que són constants,

"ade_12.gif"

El terme requadrat és "ade_13.gif", de manera que

"ade_14.gif"

Simplificant termes i usant la linealitat del valor esperat apareix la definició de la variància poblacional (el terme emmarcat de l'expressió següent):

"ade_15.gif"

La substitució del resultat dins la definició de biaix d'aquest estimador estadístic per a la variància poblacional,

"ade_16.gif"

dóna:

"ade_17.gif"

Però

"ade_18.gif"

i, per tant, el biaxis val

"ade_19.gif"

Variança sense biaix d'una mostra «

Es considera ara l'estimador estadístic

"ade_20.gif"

Seguint les primeres passes iguals que abans s'arribarà a

"ade_21.gif"

Operant perquè aparegui la definició de la variància poblacional (el terme emmarcat de l'expressió següent) es troba

"ade_22.gif"

La substitució del resultat i de

"ade_23.gif"

dins la definició de biaix de l'estimador estadístic sn2 per a la variància poblacional, s'obté

"ade_24.gif"

En conseqüència, sn2 és un estimador estadístic sense biaix de la variància poblacional.