Inferencijalne statistike su podaci koji se koriste za generalizacije o populaciji na temelju uzorka. Oni se oslanjaju na korištenje tehnike slučajnog uzorkovanja koja je osmišljena kako bi osigurala reprezentativnost uzorka. Jednostavan primjer inferencijalne statistike vjerojatno se može naći na naslovnoj stranici gotovo svih novina, a u bilo kojem članku se tvrdi da “X% Y populacije misli/osjeća/osjeća/vjeruje Z”. Izjava poput “33% 24-30-godišnjaka preferira kolač od pite” oslanja se na inferencijalne statistike. Bilo bi nepraktično ispitivati svakog pojedinog 24-30-godišnjaka o njegovim preferencijama za deserte, pa je umjesto toga ispitan reprezentativni uzorak populacije s ciljem da se napravi zaključak o populaciji u cjelini.
Inferentna i deskriptivna statistika
Drugi način korištenja podataka ankete je u obliku deskriptivne statistike. U tom slučaju se daju izjave koje jednostavno opisuju prikupljene podatke. Moguće je da se isti skup podataka koristi na deskriptivan ili inferencijalni način. Na primjer, uoči izbora u SAD-u 1,000 ljudi u gradu moglo bi biti ispitano o svojim namjerama glasanja, s rezultatom da je 430 reklo da bi glasalo za demokrata, 410 je reklo da bi glasalo za republikance, a 160 je neodlučno ili ne želi reći . Primjer korištenja ovih podataka na opisni način bio bi jednostavno navesti da 43% od 1,000 intervjuiranih ljudi u ovom gradu namjerava glasati za demokrata. Inferencijalna izjava bi bila “Demokrati drže 2% prednosti” – zaključak o namjerama glasovanja općenito izvučen je iz uzorka.
Metode
Prije donošenja bilo kakvih općih zaključaka iz uzorka važno je primijeniti ispravne metode, inače ovi zaključci možda neće biti valjani. Uobičajeni izvori pogrešaka su u načinu na koji se uzorak sastavlja, a brojni čimbenici mogu utjecati na valjanost populacije uzorka. Veličina je kritična, jer što je manja, to je veći rizik da uzorak neće biti reprezentativan za populaciju u cjelini. Također se mora voditi računa o uklanjanju izvora pristranosti. U gornjem primjeru čimbenici kao što su dob, spol i prihod mogu imati značajan utjecaj na namjere glasanja, pa ako uzorak nije sastavljen na način da odražava opću populaciju, zaključak možda neće biti valjan.
Metode uzorkovanja moraju se pažljivo birati; na primjer, ako je netko uzeo praktični uzorak koji uključuje svako 10. ime u telefonskom imeniku ili svakog 10. prolaznika u trgovačkom centru, ovaj uzorak možda neće biti valjan. Pristranost uzorka također se uzima u obzir. Na primjer, moguće je da će osobe u dobi od 24 do 30 godina koji sudjeluju na konvenciji ljubitelja pite vjerojatnije uživati u piti nego u kolačima, što bi značilo da anketa o preferencijama deserta koja je kao uzorak koristila sudionike konferencije ne bi bila vrlo reprezentativna.
Koristi
Korištenje inferencijalne statistike kamen je temelj istraživanja populacija i događaja, jer je obično teško, a često i nemoguće, ispitati svakog člana populacije ili promatrati svaki događaj. Umjesto toga, istraživači pokušavaju dobiti reprezentativan uzorak i koriste ga kao osnovu za općenitije zaključke. Na primjer, ne bi bilo moguće provjeriti medicinsku dokumentaciju svakog pojedinog pušača kako bi se utvrdila veza između pušenja i raka pluća, ali brojni slučajni uzorci koji uspoređuju pušače s nepušačima i eliminiraju druge čimbenike rizika, čvrsto su utvrđeni. ovaj link.
Istraživači koji rade s inferencijalnom statistikom pokušavaju svoje metode i prakse održati transparentnim i što je moguće rigoroznijim kako bi osigurali integritet svojih rezultata. Izjave temeljene na neformalnim anketama i brzim anketama možda nisu od velike koristi, ali u područjima kao što su medicinska istraživanja i klinička ispitivanja standardi su mnogo stroži, a inferencijalna statistika pružila je goleme količine vrijednih informacija. U drugim područjima, svakodnevno se koriste kako bi se napravile sveobuhvatne generalizacije o populacijama koje mogu oblikovati javnu politiku, dizajn proizvoda, marketing i političke kampanje.