Što su alati za rudarenje podataka?

Alati za rudarenje podataka su softverske komponente i teorije koje korisnicima omogućuju izvlačenje informacija iz podataka. Alati pojedincima i tvrtkama pružaju mogućnost prikupljanja velikih količina podataka i korištenja za donošenje odluka o određenom korisniku ili grupama korisnika. Neke od najčešćih upotreba alata za rudarenje podataka su u područjima marketinga, zaštite od prijevara i nadzora.

Ručno vađenje podataka postoji stotinama godina. Međutim, automatizacija rudarenja podataka bila je najraširenija od početka računalnog doba. Tijekom 20. stoljeća pojavile su se različite računalne znanosti koje su pomogle podržati koncept razvoja alata za rudarenje podataka. Opći cilj korištenja alata je otkriti skrivene obrasce. Na primjer, ako marketinška tvrtka utvrdi da osoba odlazi na mjesečno putovanje iz New Yorka u Los Angeles, za tu tvrtku postaje korisno da pojedincu oglašava pojedinosti o destinaciji.

Unutar industrije rudarenja podataka uspostavljeni su standardi za definiranje parametara korištenja alata za rudarenje podataka. Godišnje, Posebna interesna skupina za otkrivanje znanja i rudarenje podataka (SIGKDD) Udruge za računalne strojeve održava sastanak kako bi utvrdila koji se procesi koriste. Ista je skupina odgovorna i za procjenu etičkih implikacija analize podataka pojedinaca i tvrtki. Grupa izdaje dvogodišnji časopis pod nazivom SIGKDD Explorations.

Najrašireniji alat koji se koristi u rudarenju podataka je proces nazvan Otkrivanje znanja u bazama podataka (KDD). KDD je 1989. razvio Gregory Piatetsky-Shapiro. Koristeći ovaj alat za rudarenje podataka, korisnici su u mogućnosti obraditi neobrađene podatke, rudariti podatke za informacije i interpretirati različite rezultate u obliku upravljanja informacijama.

Jedan od najvažnijih oblika alata za rudarenje podataka koristi se za borbu protiv terorizma u 21. stoljeću. U Sjedinjenim Državama, Nacionalno istraživačko vijeće koristi koncepte uzorkovanja i istraživanja podataka temeljenog na predmetu kako bi identificirala terorističku aktivnost u velikom skupu informacija diljem svijeta. Mining uzoraka definiran je procesom lociranja uzoraka unutar velike količine podataka. Data mining na temelju predmeta pokušava identificirati odnose između pojedinaca. Obje tehnike također se mogu koristiti u općoj poslovnoj praksi definiranjem načina razmišljanja baze kupaca i interaktivnog odnosa između kupaca.