Mining iz skladišta podataka je analiza informacija sadržanih u jednoj ili više baza podataka kako bi informacije bile korisne. Te baze podataka ili skladišta podataka središnje su skladište podataka. Tvrtke prikupljaju podatke koje prikupljaju o svojim klijentima u skladištu podataka. Nakon što se informacije prikupe, one se „miniraju“ i iz njih se izvlače korisne informacije kako bi se proizvele informacije koje mogu pomoći tvrtki u donošenju poslovnih odluka koje će povećati profit ili smanjiti troškove. Trgovci na malo često koriste rudarenje iz skladišta podataka za analizu i predviđanje ponašanja svojih kupaca.
Na primjer, kada kupac ode u supermarket i preda blagajni svoju karticu čestih kupaca, podaci o njezinim kupnjama prikupljaju se i pohranjuju u skladištu podataka tvrtke. Lanac supermarketa imat će milijune podataka o tome što ljudi kupuju, kada, u kojim količinama i po kojoj cijeni. Trgovina možda zna da je prošle godine prodano 50,000 pakiranja smrznutog graška, ali sama ta informacija nije od posebne pomoći. Međutim, ako istraživanje skladišta podataka otkrije da je 75% tog smrznutog graška prodano tijekom mjeseci kada svježi grašak nije bio dostupan, ili da je 10% graška prodano u dva tjedna prije Dana zahvalnosti, tvrtka bi mogla koristiti te podatke za povećanje svoje godišnje prodaje smrznutog graška.
Tvrtke mogu koristiti tehnike rudarenja podataka iz skladišta podataka za predviđanje buduće prodaje. Data mining im također može pomoći da procijene učinak odluka o zalihama i cijenama. U supermarketu bi rudarenje podataka moglo spriječiti da trgovine ostanu bez smrznutog graška u slučaju lošeg uroda svježeg graška u određenoj godini.
Regresija rudarenja podataka je tehnika rudarenja podataka koja se koristi da pokaže što će se vjerojatno dogoditi s vrijednošću podataka ako se nešto u jednadžbi promijeni. Koristeći primjer supermarketa, regresija bi predvidjela razinu prodaje smrznutog graška ako bi se svježi grašak povećao u cijeni. Regresija koristi povijesne podatke i na njih primjenjuje formulu koja predviđa buduće ponašanje.
Tvrtke će često koristiti softversku aplikaciju za rudarenje skladišta podataka za prikupljanje i rudarenje svojih podataka. Ispravnu primjenu određuje količina podataka koju imaju i vrsta analize koju žele napraviti. Odabir ispravnog alata za rudarenje podataka ključan je za prikupljanje i tumačenje korisnih podataka.