Data mining općenito se odnosi na metodu koja se koristi za analizu podataka iz ciljanog izvora i sastavljanje te povratne informacije u korisne informacije. Ove se informacije obično koriste za pomoć organizaciji da smanji troškove u određenom području, poveća prihod ili oboje. Često olakšan aplikacijom za rudarenje podataka, njen primarni cilj je identificirati i izdvojiti obrasce sadržane u danom skupu podataka.
Ono što je najvažnije, tehnike rudarenja podataka imaju za cilj pružiti uvid koji omogućuje bolje razumijevanje podataka i njihovih bitnih značajki. Tvrtke i organizacije mogu koristiti mnogo različitih vrsta metoda rudarenja podataka. Iako mogu imati sličan pristup, svi obično teže ostvarivanju različitih ciljeva.
Svrha prediktivnih tehnika rudarenja podataka gotovo uvijek je identificirati statističke modele ili obrasce koji se mogu koristiti za predviđanje odgovora od interesa. Na primjer, financijska institucija ga može koristiti za utvrđivanje transakcija koje imaju najveću vjerojatnost prijevare. Ovo je najčešća metoda rudarenja podataka i ona koja je postala učinkovit alat za donošenje odluka za srednje i velike tvrtke. Također se pokazao učinkovitim u predviđanju ponašanja kupaca, kategorizaciji segmenata kupaca i predviđanju različitih događaja.
Sažeti modeli se oslanjaju na tehnike rudarenja podataka koje odgovaraju u skladu sa sažetim podacima. Na primjer, organizacija može dodijeliti putnike zrakoplovnih prijevoznika ili transakcije kreditnim karticama u različite skupine na temelju njihovih karakteristika izvučenih iz analitičkog procesa. Ovaj model također može pomoći tvrtkama da steknu dublje razumijevanje baze svojih kupaca.
Modeli povezivanja uzimaju u obzir da se određeni događaji mogu redovito događati zajedno. To može biti istovremena kupnja predmeta kao što su miš i tipkovnica ili slijed događaja koji su doveli do kvara određenog hardverskog uređaja. Modeli povezivanja predstavljaju tehnike rudarenja podataka koje se koriste za identifikaciju i karakterizaciju ovih povezanih pojava.
Mrežni modeli koriste rudarenje podataka kako bi otkrili strukture podataka koje su u obliku čvorova i veza. Na primjer, organizirani krug prijevara mogao bi sastaviti popis ukradenih brojeva kreditnih kartica, a zatim se okrenuti i koristiti ih za kupnju artikala na mreži. Na ovoj ilustraciji, kreditne kartice i online trgovci predstavljaju čvorove, dok stvarne transakcije djeluju kao veze.
Data mining ima mnogo svrha i može se koristiti za pozitivnu i zlonamjernu dobit. Sve više organizacija dolazi da otkrije prednosti spajanja tehnika rudarenja podataka za formiranje hibridnih modela. Ove snažne kombinacije često rezultiraju aplikacijama s vrhunskim performansama. Integriranjem ključnih značajki različitih metoda u pojedinačna hibridna rješenja, organizacije obično mogu prevladati ograničenja pojedinačnih strateških sustava.