Što je krivulja raspodjele frekvencije?

Krivulja distribucije frekvencije je vrsta deskriptivne statistike prikazane kao graf koji pokazuje učestalost pojavljivanja dane varijable, gdje x predstavlja neku mjeru pojavljivanja varijable, a y predstavlja broj slučajeva na svakoj frekvenciji. Uz vrlo velike populacije, kaže se da krivulja raspodjele frekvencije nalikuje statističkom idealu zvonaste krivulje i poprima svojstva normalne distribucije. Zvonasta krivulja – također poznata kao normalna krivulja – je prikladno nazvana. Podsjeća na zaobljeno zvono sa simetričnim krajevima koji se sužavaju prema dolje i prema van prema nultoj frekvenciji na x-osi. Zvonasta krivulja prepolovljena je idealiziranom identičnom sredinom (μ), medijanom i modom svih izmjerenih podataka, s polovicom svakog grafikona s obje strane.

Kada se pretpostavi da krivulja raspodjele frekvencije uzorka posjeduje svojstva idealne zvonaste krivulje, tada se mogu pretpostaviti i aspekti populacije koja se proučava. Osim toga, standardne statističke formule mogu dati stupanj do kojeg se može osloniti na takve pretpostavke. Uz idealnu zvonastu krivulju, pretpostavlja se da su srednja vrijednost populacije, medijan i modus jednaki. Izračun standardne devijacije, σ, zatim daje mjeru “širenja” podataka o populaciji. U idealnoj krivulji, svi osim 0.25 posto ukupnih podataka populacije nalaze se unutar plus ili minus tri standardne devijacije od srednje vrijednosti krivulje raspodjele frekvencije, ili između μ-3σ i μ+3σ.

Iako se idealna zvonasta krivulja razlikuje od krivulje distribucije učestalosti uzorka na više načina, ona omogućuje pretpostavljeno razumijevanje populacije uzorka, pa čak i lokacije jednog mjerenja unutar ukupne populacije uzorka. U idealnoj krivulji, 68 posto vrijednosti za varijablu mjerene u uzorku, a vjerojatno i u populaciji, bit će unutar jedne standardne devijacije od srednje vrijednosti u bilo kojem smjeru, ili μ-1σ i μ+1σ. Krećući se dalje duž zvonaste krivulje, vrijednosti za 95 posto uzorka i populacije nalazit će se unutar plus ili minus dva standardna odstupanja od srednje vrijednosti, odnosno μ-2σ i μ+2σ. Na samim rubovima krivulje raspodjele frekvencije, sve osim 0.25 posto spada u plus ili minus tri standardne devijacije. Ona rijetka mjerenja koja leže u 0.25 posto izvan mjera triju standardnih devijacija poznata su kao odstupanja i često se uklanjaju iz podataka kada se izvode inferencijalni izračuni.