Što je zakon velikih brojeva?

Zakon velikih brojeva je statistički teorem koji postulira da će se prosjek uzorka slučajnih varijabli približiti teoretskom prosjeku kako se broj slučajnih varijabli povećava. Drugim riječima, što je veći statistički uzorak, veća je vjerojatnost da će rezultati biti točniji u odnosu na ukupnu sliku. Niži brojevi uzoraka imaju tendenciju da lakše iskrive ishod, iako također mogu biti prilično točni.

Novčić je dobar primjer kojim se može pokazati zakon velikih brojeva. Često se koristi na početnim tečajevima statistike kako bi se pokazalo koliko ovaj zakon može biti učinkovit. Većina kovanica ima dvije strane, glavu i rep. Ako se novčić prevrne, logika bi rekla da su jednake šanse da novčić sleti na stranu glave ili repa. Naravno, to ovisi o ravnoteži novčića, njegovim magnetskim svojstvima i drugim čimbenicima, ali općenito je to točno.

Ako se novčić baci samo nekoliko puta, rezultati možda neće pokazati da su jednake šanse da padne na glavu i rep. Na primjer, bacanje novčića četiri puta može dati tri glave i jedan rep. Mogao bi čak dati četiri glave i bez repa. Ovo je statistička anomalija.

Međutim, zakon velikih brojeva kaže da kako se uzorak povećava, ti rezultati će najvjerojatnije biti u skladu s pravim prikazom mogućnosti. Ako se novčić baci 200 puta, postoji velika vjerojatnost da će broj puta da padne na glavu i rep biti blizu 100 svaki. Međutim, zakon ili veliki brojevi ne predviđaju da će svaki biti točno 100, samo da će vjerojatno biti reprezentativniji za pravi raspon mogućnosti od manjeg prosjeka.

Zakon velikih brojeva pokazuje zašto je potreban adekvatan uzorak. Statistika se koristi jer nema dovoljno vremena ili je nepraktično koristiti cjelokupnu populaciju kao uzorak. Međutim, uzorak populacije znači da će postojati reprezentativni članovi populacije koji se ne računaju. Kako bi se osiguralo da uzorak odražava ukupnu populaciju, potreban je odgovarajući broj slučajnih varijabli.

Određivanje potrebnog uzorka obično ovisi o brojnim čimbenicima, od kojih je glavni interval pouzdanosti. Na primjer, statistički interval pouzdanosti je razina sigurnosti da će populacija pasti unutar određenih parametara. Postavljanje intervala povjerenja od 95 posto značilo bi da postoji razumna sigurnost da će 95 posto stanovništva spadati u te parametre. Uzorak potreban za određene intervale pouzdanosti određen je formulom koja uzima u obzir broj u populaciji kao i željeni interval pouzdanosti.
Dok je zakon velikih brojeva jednostavan koncept, teoremi i formule koji ga opravdavaju mogu biti prilično složeni. Jednostavno rečeno, zakon ili veliki brojevi najbolje su objašnjenje zašto su veći uzorci bolji od manjih. Nitko ne može pozitivno jamčiti da će statističko uzorkovanje biti potpuno točno, ali ovaj zakon pomaže spriječiti mnoge netočne rezultate.