Što je model rudarenja podataka?

Data mining opisuje proces izdvajanja podataka iz velikih skupova informacija i prezentiranja na jedinstven način. Taj se proces često nalazi u studijama poslovne inteligencije, u kojima stručnjaci prikupljaju velike skupove podataka o tržištu ili poslovanju poduzeća i pokušavaju otkriti dosad neprepoznate odnose i trendove. Model rudarenja podataka odnosi se na tehnike koje stručnjaci koriste za grupiranje i prezentiranje informacija, kao i na načine na koje mogu primijeniti informacije na određena pitanja i probleme.

Mnogi stručnjaci regresiju data mininga smatraju najosnovnijim i najčešće korištenim modelom rudarenja podataka. U tom procesu stručnjak analizira skup podataka i stvara formulu koja ih opisuje. Mnogi financijski analitičari koriste ovu tehniku ​​za predviđanje cijena i tržišnih trendova. Ovaj model najbolje funkcionira u scenarijima u kojima se očekuje da podaci ostanu dosljedni.

Drugi popularni model rudarenja podataka temelji se na povezivanju. Stručnjak može analizirati skupove podataka kako bi odredio koje se komponente često pojavljuju zajedno. Kada se dvije komponente uvijek iznova uparuju, istraživač može pretpostaviti da postoji neka povezanost između njih. Na primjer, istraživač koji koristi rudarenje podataka kako bi naučio o performansama maloprodajne trgovine mogao bi otkriti da potrošači često kupuju olovke i olovke u isto vrijeme kada kupuju papir. Upravitelj može koristiti informacije naučene iz modela rudarenja podataka kako bi povećao prodaju prikazivanjem svih povezanih stavki u jednom prostoru.

Faktorska analiza je još jedan uobičajeni model rudarenja podataka. U tom procesu istraživač prikuplja niz različitih varijabli i pokušava locirati čimbenike koji određuju fluktuacije vrijednosti. Istraživač tržišta, na primjer, može naučiti iz baze kupaca kako ocjenjuje značajke sličnih proizvoda. Istraživač tada može organizirati ove informacije kako bi ilustrirao čimbenike koji određuju potrošačku procjenu karakteristika. Dok zagovornici ovog modela vjeruju da može istaknuti zajedništvo među naizgled različitim varijablama, neki kritičari vjeruju da ovaj model može navesti neke tumače da pretpostave uzročnost određenih pojava kada sve informacije potrebne za određivanje uzročnosti možda nisu dostupne.

Istraživači mogu koristiti model rudarenja podataka koji se temelji na kategorizaciji za jednostavnije probleme. Koristeći ovu tehniku, stručnjaci organiziraju podatke prema svojim klasifikacijama i nastoje ih organizirati u vizualnom obliku, kao što je stablo ili grafikon. Ovakav model posebno je koristan u scenarijima u kojima pojedinac mora birati između nekoliko opcija u svakoj kategoriji. Dizajneru bi ovaj model mogao biti koristan ako u svakom koraku procesa može birati između nekoliko materijala.