Što je Fisherov točan test?

Fisherov točan test je test statističke značajnosti koji se koristi za male veličine uzoraka. To je jedan od brojnih testova koji se koriste za analizu nepredviđenih tablica, koje prikazuju interakciju dviju ili više varijabli. Ovaj test je izumio engleski znanstvenik Ronald Fisher, a zove se egzaktan jer precizno izračunava statističku značajnost, a ne pomoću aproksimacije.

Da bismo razumjeli kako funkcionira Fisherov točan test, bitno je razumjeti što je to tablica nepredviđenih situacija i kako se koristi. U najjednostavnijem primjeru, postoje samo dvije varijable koje se mogu usporediti u tablici nepredviđenih okolnosti. Obično su to kategoričke varijable. Kao primjer, zamislite da provodite studiju o tome korelira li spol s posjedovanjem kućnih ljubimaca. U ovoj studiji postoje dvije kategoričke varijable: spol, bilo muško ili žensko, i vlasništvo kućnih ljubimaca.

Tablica nepredviđenih situacija postavlja se s jednom varijablom na vrhu, a drugom s lijeve strane, tako da postoji okvir za svaku kombinaciju varijabli. Zbroji su dati dolje i krajnje desno. Evo kako bi tablica nepredviđenih situacija izgledala za primjer studije, pod pretpostavkom ankete od 24 osobe:

Vlasnik kućnog ljubimca
Nije vlasnik kućnog ljubimca
ukupno
Muški
1
9
10
ženski
11
3
14
ukupno
12
12
24

Fisherov točan test izračunava odstupanje od nulte hipoteze, koja tvrdi da nema pristranosti u podacima ili da dvije kategoričke varijable nemaju međusobnu korelaciju. U slučaju ovog primjera, nulta hipoteza je da muškarci i žene imaju jednaku vjerojatnost posjedovanja kućnih ljubimaca. Fisherov točan test dizajniran je za tablice nepredviđenih situacija s malom veličinom uzorka ili velikim odstupanjima između brojeva ćelija, kao što je gore prikazano. Za tablice nepredviđenih situacija s velikom veličinom uzorka i dobro izbalansiranim brojevima u svakoj ćeliji tablice, Fisherov točan test nije točan, a poželjniji je hi-kvadrat test.

Analizirajući podatke u gornjoj tablici, Fisherov točan test služi za određivanje vjerojatnosti da je vlasništvo kućnih ljubimaca neravnomjerno raspoređeno među muškarcima i ženama u uzorku. Znamo da deset od 24 ispitane osobe posjeduju kućne ljubimce, a da su 12 od 24 ženke. Vjerojatnost da će se deset nasumično odabranih iz uzorka sastojati od devet žena i jednog muškarca sugerirati će statističku značajnost distribucije vlasnika kućnih ljubimaca u uzorku.

Vjerojatnost se označava slovom p. Fisherov točan test određuje p-vrijednost za gornje podatke množenjem faktorijala svakog graničnog zbroja – u gornjoj tablici, 10, 14, 12 i 12 – i dijeljenjem rezultata s umnoškom faktorijala svakog broja ćelije i od ukupnog zbroja. Faktorijal je umnožak svih pozitivnih cijelih brojeva koji su manji ili jednaki danom broju. 10!, izgovara se “deset faktorijala”, dakle jednako je 10X9X8X7X6X5X4X3X2X1, ili 3,628,800.
Za gornju tablicu, dakle, p= (10!)(14!)(12!)(12!)/(1!)(9!)(11!)(3!)(24!). Koristeći kalkulator, može se utvrditi da je vjerojatnost dobivanja brojeva u gornjoj tablici ispod 2%, znatno ispod šanse, ako je nulta hipoteza točna. Stoga je vrlo malo vjerojatno da u uzorku studije nema nepredviđenih okolnosti ili značajne veze između spola i vlasništva kućnog ljubimca.