Data mining za upravljanje odnosima s klijentima (CRM) odnosi se na proces pretraživanja baza podataka o odnosima s kupcima i analiziranja prikupljenih podataka o ponašanju kupaca. Ovi podaci pomažu trgovcima da bolje usredotoče svoje kampanje, što dovodi do povećanja zadržavanja kupaca i prodaje. CRM rudarenje podataka također je poznato kao istraživanje podataka i otkrivanje znanja. Dvije su glavne kategorije povezane s rudarenjem podataka: deskriptivna analiza i prediktivno modeliranje.
Deskriptivna analiza koristi segmentaciju i grupiranje za bolju analizu postavljenog obrasca ponašanja među određenom skupinom kupaca. Kupci se mogu grupirati prema spolu, dobi, rasi i drugim kategorijama. Glavni cilj segmenta je ponuditi marketeru skupinu sličnih kupaca kako bi učinkovitije prikupio podatke za korisne uvide.
Grupiranje agregata grupa segmenata. Svaki klaster se međusobno isključuje i karakterizira ga skup unaprijed određenih karakteristika. Na primjer, klaster bi mogao uključivati žene u dobi od 18 do 25 godina koje su kupile određeni lak za nokte tijekom posljednja dva tjedna prosinca 2010. Ovo je primjer kvalitativne metode CRM data mininga.
U neisključujućim segmentima, drugom obliku deskriptivne analize, određeni skup ponašanja kupaca dovodi do potpuno novog skupa ponašanja. Na primjer, grupa kupaca mogla bi potrošiti značajnu količinu novca na spa usluge, ali ne i na povezane usluge kao što su frizerska i salonska njega. Ova vrsta CRM data mininga zahtijeva napredniju statističku analizu od osnovne segmentacije.
Prediktivno modeliranje je popularnije od dvije kategorije rudarenja podataka CRM-a. Mjeri stupanj korelacije između dva čimbenika ponašanja kupaca i statističku pouzdanost te korelacije. Prediktivni model izgrađen je pomoću aplikacije za rudarenje podataka koja dodjeljuje rezultate svakom kupcu, što ukazuje na vjerojatnost da će se kupac ponašati na isti način u budućnosti. Na primjer, model može pomoći trgovcu da odredi vjerojatnost da će oženjeni muški kupac u dobi od 31 do 42 godine s djecom kupiti određenu marku kosilice u sljedećih šest mjeseci.
Specifičnost je vrlo važna u CRM data miningu pomoću prediktivnih modela. U tu svrhu koristi se nekoliko vrsta metoda. Univarijacijski model uspoređuje jednu varijablu s nekoliko drugih varijabli kako bi se odredio odnos s najvećom korelacijom. Hi-kvadrat automatske analize detekcije interakcije (CHAID) i stabala klasifikacije i regresije (CART) prikazuju stabla odluka, gdje jedna varijabla uzrokuje instancu jedne ili više varijabli. Multivarijantni regresijski model testira nekoliko varijabli jedna protiv druge kako bi se procijenile moguće korelacije.