Što je hipergeometrijska distribucija?

Hipergeometrijska distribucija opisuje vjerojatnost određenih događaja kada se slijed predmeta izvuče iz fiksnog skupa, kao što je odabir karata za igranje iz špila. Ključna karakteristika događaja koji slijede hipergeometrijsku distribuciju vjerojatnosti je da se stavke ne zamjenjuju između izvlačenja. Nakon što je određeni objekt odabran, ne može se ponovno odabrati. Ova značajka je najznačajnija kada se radi s malim populacijama.

Revizori za ocjenu kvalitete koriste hipergeometrijsku distribuciju kada analiziraju broj neispravnih proizvoda u danoj skupini. Proizvodi se ostavljaju na stranu nakon testiranja jer nema razloga da se isti proizvod testira dvaput. Dakle, odabir se vrši bez zamjene.

Poker vjerojatnosti se izračunavaju pomoću hipergeometrijske distribucije jer se karte ne miješaju natrag u špil unutar dane ruke. U početku, na primjer, jedna četvrtina karata u standardnom špilu su pikovi, ali vjerojatnost da će vam se podijeliti dvije karte i otkriti da su obje pikovi nije 1/4 * 1/4 = 1/16. Nakon što dobijete prvi pik, u špilu ostaje manje pika, pa je vjerojatnost da će vam se podijeliti još jedan pik samo 12/51. Dakle, vjerojatnost da će vam se podijeliti dvije karte i da se obje karte smatraju pikovima je 1/4 * 12/51 = 1/17.

Objekti se ne zamjenjuju između izvlačenja, pa je vjerojatnost ekstremnih scenarija smanjena za hipergeometrijsku distribuciju. Može se usporediti dijeljenje crvenih ili crnih karata iz standardnog špila s bacanjem novčića. Pošteni novčić pola će vremena pasti na “glave”, a polovica karata u standardnom špilu je crna. Ipak, vjerojatnost da ćete dobiti pet uzastopnih glava prilikom bacanja novčića veća je od vjerojatnosti da će vam se podijeliti ruka od pet karata i otkriti da su sve crne karte. Vjerojatnost pet uzastopnih glava je 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, odnosno oko 3 posto, a vjerojatnost pet crnih karata je 26/52 * 25/ 51 * 24/50 * 23/49 * 22/48 = 253/9996, odnosno oko 2.5 posto.

Uzorkovanje bez zamjene smanjuje vjerojatnost ekstremnih slučajeva, ali ne utječe na aritmetičku sredinu distribucije. Prosječan broj glava koji se očekuje kada netko baca novčić pet puta je 2.5, a to je jednako prosječnom broju crnih karata koji se očekuju u ruci od pet karata. Kao što je vrlo malo vjerojatno da je svih pet karata crne, tako je malo vjerojatno da nijedna nije. To je opisano matematičkim jezikom govoreći da zamjena smanjuje varijancu bez utjecaja na očekivanu vrijednost distribucije.