Anàlisi de Dades Experimentals
© Antoni Amengual Colom. Departament de Física, Universitat de les Illes Balears.

Versió 1.0 publicada al setembre de 2013. DL: PM 860-2013.

Distribució de Poisson

Introducció a la distribució de Poisson

Introducció «

El nombre d'àtoms d'una substància radioactiva que es desintegren en un interval de temps Δ molt més petit que la vida mitjana τ1/2 de l'element radioactiu és una variable aleatòria. S'ha de suposar que Δ és molt més petit que τ1/2 perquè l'activitat es pugui considerar constant. Si la probabilitat de desintegració durant l'interval Δ és p, la probabilitat que k àtoms dels n que hi ha en total es desintegrin durant l'interval donat, és

"ade_1.gif"

A la pràctica, és impossible avaluar aquesta expressió de la funció de probabilitat binomial perquè n és un número enorme. No obstant això, atès que p té un valor extremadament petit, es pot cercar una aproximació. Aquí se cercarà una expressió límit per a la distribucio binomial de mitjana μ = n p en el cas que n sigui molt gran i p = 1/μ, molt petit. Es demostrarà que la funció de probabilitat binomial en aquest límit dóna l'anomenada funció de probabilitat de Poisson

"ade_2.gif"

Per a les mesures experimentals en Física, la distribució de Poisson s'usa en el comptatge de processos similars al de la radioactivitat. En altres àmbits, la distribució s'usa per modelar situacions quan

• La probabilitat que es doni un únic èxit en un interval Δ és proporcional a Δ.

• La probabilitat que es donin dos èxits en un mateix interval Δ és negligible.

• La probabilitat que es doni un èxit és constant en diferents intervals.

• La probabilitat que es doni un èxit en un interval és independent de la probabilitat que es doni un èxit en qualsevol altre interval sense solapament amb el primer.

L'interval Δ no sempre és temporal, en algunes ocasions és un volum: El nombre d'estrelles en un volum d'espai es modela amb una distribució de Poisson.

Els esdeveniments singulars que es donen en temps aleatoris però amb un nombre mitjà constant per unitat de temps Δ es descriuen generalment amb la distribució de Poisson. S'esmenten a continuació dos exemples, el primer d'interès històric.

Accidents a la cavalleria prussiana «

L'estadístic Ladislaus Josephowitsch Bortkiewicz (1868-1931) publicà el llibre La llei dels números petits al 1898. Era un estudi sobre la distribució de Poisson i contenia un anàlisi un tant sorprenent que s'ha fet famós: és l'anàlisi del nombre de soldats morts per potades de cavalls per any i per cos de l'exèrcit prussià. A l'article sobre Bortkiewicz a la International Encyclopedia of the Social Sciences 2 (1968) es diu:

«Es varen examinar catorze cossos de l'exèrcit durant vint anys. Durant més de la meitat de les combinacions exèrcit-any no hi va haver morts per potades de cavalls, per a les altres combinacions el nombre de morts s'eleven fins a quatre. És de suposar que el risc de rebre una potada letal canviava amb els anys i entre els exèrcits però la distribució quedava remarcablement ben ajustada amb una distribució de Poisson.»

A la imatge es mostra el dibuix d'un músic de l'exèrcit prussià en un fragment de Preussisches Heer–Garde Artillerie (c. 1829) de Joseph Scholz (imatge declarada de domini públic a la pàgina web kimballtrombone amb la reproducció completa).

Gols dels mundials de futbol «

En una article titulat "Using Soccer Goals to Motivate the Poisson Process"1 es mostrà que el nombre de gols en els partits de futbol dels mundials de 1990, 1994, 1998 i 2002 quedava ben descrit per la distribució de Poisson. En els 232 partits d'aquests quatre mundials es marcaren 575 gols dins els 90 minuts reglamentaris (els gols de les pròrrogues i de les tandes de penals que resolgueren alguns partits no es varen incloure). L'estudi tenia com a precedent un article en el que s'analitzaven els gols en partits de hoquei sobre gel.

La taula 1 reprodueix un fragment d'una taula de l'article esmentat. Mostra el nombre de partits en el que no es marcà cap gol, se'n marcà 1, se'n marcaren 2, 3, 4 o 5, o se'n marcaren 6 o més. A la tercera columna es mostra el nombre de partits que quedaren amb aquests nombres de gols segons la funció de probabilitat de Poisson de mitjana μ = 575/232 = 2.48.

La distribució dels gols es descobreix, usant les mateixes paraules de l'article sobre Bortkiewicz, «remarcablement ben ajustada amb una distribució de Poisson».

GolsPartits n Pμ(g)
01919
14948
26060
34749
43231
51815
≥ 679

Taula 1. La primera columna és el nombre de gols g marcats en els partits durant el temps reglamentari (no s'inclouen els gols de les pròrrogues ni de les tandes de penals). La segona columna és el nombre de partits que acabaren amb aquest nombre de gols. La tercera columna és el valor de la distribució de Poisson per a Pμ(g) amb μ = 2.48, la mitjana de gols per partit. Dades extretes de Chu, S. (2003), INFORMS Transactions on Education, Vol. 3, No. 2, pàg. 62-68. La imatge mostra els logos dels quatre mundials considerats FIFA World Cups.

L'article esmentat es publicà a l'any 2003 i no es pot evitar la temptació d'analitzar els gols dels partits dels dos mundials que han tingut lloc des de llavors, el d'Alemanya de 2006 i el de Sud-àfrica de 2010 (que guanyà la selecció espanyola per primera vegada amb un gol d'Andrés Iniesta a 4 minuts del final de la pròrroga). S'han comptabilitzat els gols en els 64 partits de cada un dels mundials usant els resultats dels partits guardats a la web de la FIFA. Si es marca sobre els logos dels mundials adjunts es veuran aquests resultats.

La mitjana de gols fou de 2.25 al 2006 i de 2.39 al 2010. Entre els dos mundials la mitjana fou 2.32 gols/partit. Les mitjanes defineixen les funcions de probabilitat de Poisson que s'usen per determinar el nombre esperat de partits amb g gols que es dóna a la Taula 2. La concordança és remarcable.

gols gPartits 2006 n Pμ(g)Partits 2012 n Pμ(g)Partits suma 2n Pμ(g)
086661413
1131416142929
2181713173134
3111414142526
4108781715
5245477
≥6332344

Taula 2. La primera columna és el nombre de gols g marcats en els partits durant el temps reglamentari (no s'inclouen els gols de les pròrrogues ni de les tandes de penals). Les columnes parells tenen el nombre de partits que acabaren amb aquest nombre de gols en els mundials de 2006, 2010 i entre els dos, respectivament. Al costat de cada una d'aquestes columnes n'hi ha una amb els valors esperats segons la funció de probabilitat de Poisson.