Znanstvenici nastoje uspostaviti teorije ili otkriti zakone koji objašnjavaju opažanja ili rezultate eksperimenata. Prvi korak je konstruirati hipotezu, ili pokušaj objašnjenja, za skup činjenica, a zatim ga testirati. Obično se koriste statističke metode: uzorak podataka se ispituje kako bi se utvrdilo podržava li predloženo objašnjenje. Obično će se konstruirati nulta hipoteza, koja je u suprotnosti s objašnjenjem — to se obično označava s H0 — dok se samo objašnjenje naziva alternativnom hipotezom, označenom s HA. U početku se pretpostavlja da je H0 istinit, a zadatak istraživača je pokazati da podaci ne potvrđuju ovaj zaključak.
Testiranje hipoteze
Obično su H0 i HA dvije međusobno isključive tvrdnje – ne mogu obje biti istinite. Također bi trebali biti iscrpni; odnosno trebaju obuhvatiti sve moguće ishode eksperimentalnog istraživanja. Dobiva se uzorak podataka prema kojem će se testirati nulta hipoteza. Uzorak mora biti dovoljne veličine da omogući donošenje valjanih zaključaka i ne smije biti bez pristranosti koje bi mogle utjecati na rezultat.
Istraživači tada moraju ustanoviti vrijednost, ili jedan ili više skupova vrijednosti, koji ne podržavaju H0. Ako se utvrdi da su podaci u skladu s tim vrijednostima, nulta hipoteza će biti odbačena, a alternativna hipoteza se tada može reći da je vjerojatno istinita. Podaci testa često se mogu prikazati kao grafikon, s vrhom u sredini i “repom” s obje strane. Obično će se većina vrijednosti za stvar koja se testira grupirati oko sredine raspona, spuštajući se prema niskim i visokim ekstremima. Na primjer, skup mjerenja visine velikog uzorka ljudi pokazat će većinu oko sredine raspona, a manje brojeve prema vrlo kratkim i vrlo visokim krajevima.
Postoje tri vrste testova koji se mogu primijeniti na skup podataka. U testu desnog repa utvrđeno je da podaci koji su iznad određene vrijednosti, poznate kao kritična vrijednost, ne podržavaju nultu hipotezu; u lijevostranom testu ovi podaci leže ispod kritične vrijednosti; u dvostranom testu, podaci koji ne podržavaju H0 leže iznad i ispod određene vrijednosti ili raspona vrijednosti. Nije moguće potpuno opovrgnuti nultu hipotezu; umjesto toga, istraživači se moraju složiti oko tumačenja podataka na temelju toga koliko je vjerojatno da će H0 biti odbačen kada je zapravo istinit. Ova je vjerojatnost poznata kao razina značajnosti. Na primjer, ako je određeni udio podataka iznad kritične vrijednosti u testu s desnim repom, to može značiti da postoji samo 1% šanse da je H0 istinit.
Primjer
Tvrtka za lijekove možda testira rezultate novog tretmana za smanjenje kolesterola. U ovom slučaju, nulta hipoteza bi bila da se razina kolesterola ne smanjuje nakon uzimanja lijeka, dok bi alternativna hipoteza bila da se razine smanjuju. Pretpostavljalo bi se da je H0 istinit, a istraživači bi zatim prikupili podatke koje bi analizirali u pokušaju da ih odbace.
Podaci se mogu sastojati od mjerenja kolesterola na uzorku ljudi prije i nakon uzimanja lijeka, u usporedbi sa sličnim uzorkom koji ga nisu uzimali, u istom razdoblju. Istraživači bi se tada mogli složiti oko toga koliko se smanjenje i u kojem omjeru uzorka koji je uzimao lijek može smatrati značajnim. Ove informacije mogu se koristiti za postavljanje kritične vrijednosti, kao što je smanjenje od 10% kod 80% onih koji su uzimali lijek. Ako podaci padnu iznad ovih vrijednosti, nulta hipoteza se odbacuje, a alternativna hipoteza prihvaća.