Što je neparametarski test?

Neparametarski test je vrsta statističkog testiranja hipoteze koja ne pretpostavlja normalnu distribuciju. Iz tog razloga, neparametarski testovi se ponekad nazivaju i bez distribucije. Neparametarski test je robusniji od standardnog testa, općenito zahtijeva manje uzorke, manja je vjerojatnost da će na njega utjecati udaljena opažanja i može se primijeniti s manje pretpostavki. S druge strane, neparametarski testovi mogu biti manje učinkoviti od svojih standardnih kolega, osobito ako je populacija uistinu normalno raspoređena. Neparametrijsko testiranje posebno je učinkovito za pitanja koja se bave frekvencijama i proporcijama.

Standardno testiranje hipoteze uspoređuje uzorak iz testne populacije s uzorkom iz kontrolne populacije kako bi se utvrdilo je li testna populacija statistički usporediva s kontrolnom populacijom. Ako je razlika između parametra ili parametara uzorka – obično srednje vrijednosti i/ili varijance – dovoljno velika, tada se može ocijeniti da se testni uzorak razlikuje od kontrolne populacije. Takvo parametarsko testiranje zahtijeva da parametri dolaze iz normalne distribucije.

Matematički je dokazano da će se veličina uzorka od 30 ili više ponašati približno kao normalna distribucija, pa se ovaj zahtjev općenito pretpostavlja. Međutim, ako pretpostavka nije opravdana, rezultati testiranja možda neće biti valjani. Neparametrijsko testiranje izbjegava ovu pretpostavku.

Umjesto toga, testiranje neparametarskih hipoteza obično ispituje podatke ili kategoriziranjem ili redoslijedom. Ako su uzorkovana i kontrolna populacija iste i ako su podaci ispravno prikupljeni, sve razlike između njihovih kategorija ili rangiranja isključivo su rezultat slučajnosti. Ako je vjerojatnost da su se te razlike mogle dogoditi slučajnim slučajem, također nazvana P-vrijednost, manja od odabrane značajne vjerojatnosti, obično 5 posto ili 1 posto, tada ispitivač odbacuje hipotezu da su uzorak i kontrolna populacija isti i zaključuje da su različiti.

Jedan uobičajeni neparametarski test je Hi-kvadrat test, koji se koristi za usporedbu promatranih frekvencija ili proporcija. Kada se ispituje samo jedan skup frekvencija, to se često naziva testom ispravnosti i koristi se za određivanje uklapaju li se promatrane frekvencije unutar raspona koji bi se očekivao. Na primjer, test dobrote pristajanja mogao bi se koristiti da se utvrdi je li stol za rulet bio namješten uspoređujući rezultate stola s rezultatima koje predviđa teorija vjerojatnosti ili da se utvrdi je li lijek protiv glavobolje bio učinkovit uspoređivanjem udjela ljudi koji imaju glavobolju. poboljšao lijek u odnosu na udio ljudi čija se glavobolja poboljšala kada su uzeli placebo. Ako se ispituju dvije frekvencije, tada se Hi-kvadrat neparametarski test može koristiti za testiranje korelacije ili neovisnosti između čimbenika. Politički anketari često traže korelaciju između društvenih, ekonomskih ili demografskih čimbenika i političkih uvjerenja, kao što je uvid u postoji li korelacija između obrazovanja osobe i odobrava li on ili ona način na koji izabrani dužnosnik radi.

Drugi neparametarski test je Wilcoxonov test zbroja ranga, koji se općenito koristi u istim situacijama kao i testiranje standardnih parametarskih hipoteza. Međutim, umjesto ispitivanja srednje vrijednosti svakog uzorka, Wilcoxonov test ispituje rang svake vrijednosti ako su dva uzorka poredana od najmanjeg prema najvećem. Ako su dva uzorka ista, svaka skupina treba biti ravnomjerno raspoređena po rangiranju. Ako je jedna skupina grupirana na donjem ili gornjem dijelu ljestvice, to znači da su dvije skupine različite.
Na primjer, pretpostavimo da je netko želio utvrditi jesu li animirani filmovi duži ili kraći od neanimiranih filmova. Za standardni test, on ili ona će odrediti prosječno trajanje za uzorak animiranih filmova i za uzorak filmova uživo i usporediti razliku s varijansom uzoraka. Za Wilcoxonov neparametarski test, vremena filma se poredaju od najmanjeg prema najvećem, a rangovi vremena animiranog filma se zbrajaju.

Osoba bi mogla izračunati vjerojatnost da će zbroj ranga biti te veličine ili manji određivanjem broja mogućih narudžbi s danim zbrojem ranga i ukupnog broja mogućih poredaka, izračun koji je jednostavan s obzirom na dovoljnu snagu izračuna grube sile. Uz dva mala uzorka od po šest filmova, već postoje 924 moguća rasporeda ljestvica, broj koji brzo raste mnogo veći kako se filmovi dodaju. Alternativno, postoje objavljene tablice koje daju vjerojatnosti koje odgovaraju zadanim zbrojima rangova za dane veličine uzorka. Oni se mogu pronaći u statističkim tekstovima ili na internetu.
Neparametrijsko testiranje je sve veće područje. Može se primijeniti u bilo kojem području u kojem su korištene i konvencionalnije statistike. Prijave su osobito česte u društvenim znanostima i medicini, međutim, posebno kada se ne može primijeniti normalna distribucija.