Korelacijsko grupiranje se izvodi na bazama podataka i drugim velikim izvorima podataka kako bi se grupirali slični skupovi podataka, a istovremeno se korisnik upozorava na različite skupove podataka. To se na nekim grafikonima može savršeno izvesti, dok će drugi imati pogreške jer će biti teško razlikovati slične od različitih podataka. U slučaju potonjeg, korelacijsko grupiranje pomoći će automatski smanjiti pogrešku. Ovo se često koristi za rudarenje podataka ili za traženje sličnosti u glomaznim podacima. Različiti podaci se obično brišu ili stavljaju u zaseban klaster.
Kada se koristi funkcija klasteriranja korelacije, ona traži podatke na temelju korisničkih uputa. Korisnik će programu reći što treba tražiti i, kada se pronađe, gdje smjestiti podatke. To se obično primjenjuje na vrlo velike izvore podataka kada bi bilo nemoguće — ili trebati previše sati — ručno pretraživati podatke. Može postojati savršeno grupiranje ili nesavršeno grupiranje.
Savršeno grupiranje je idealan scenarij. To znači da postoje samo dvije vrste podataka, a jedna je ono što korisnik traži dok je druga nepotrebna. Svi pozitivni, odnosno potrebni podaci stavljaju se u jedan klaster, dok se ostali podaci brišu ili premještaju. U ovom scenariju nema zabune i sve radi savršeno.
Većina složenih grafova ne dopušta savršeno grupiranje i umjesto toga su nesavršeni. Na primjer, graf ima tri varijable: X, Y i Z. X,Y je sličan, X,Z je sličan, ali je Y,Z različit. Međutim, tri varijabilna klastera toliko su slična da je nemoguće imati savršeno korelacijsko grupiranje. Program će raditi na povećanju broja pozitivnih korelacija, ali to će i dalje zahtijevati neko ručno pretraživanje od korisnika.
U rudarenju podataka, posebno kada se radi o velikim skupovima podataka, korelacijsko grupiranje se koristi za grupiranje sličnih podataka sa sličnim podacima. Na primjer, ako je poduzeće kopalo podatke za veliku web stranicu ili bazu podataka i želi znati samo o određenom aspektu, trebat će zauvijek pretraživanje svih podataka za taj aspekt. Korištenjem formule za grupiranje, podaci će biti izdvojeni za pravilnu analizu.
Različite informacije obrađuju se isključivo na temelju korisničkih uputa. Korisnik može odabrati slanje različitih podataka u različite klastere, jer informacije mogu biti korisne za druge projekte. Ako su podaci nepotrebni i samo troše memoriju, tada se različite informacije izbacuju. Kod nesavršenog klasteriranja moguće je da neke različite informacije neće biti izbačene jer su toliko slične podacima koje korisnik traži.