Što je Spatial Data Mining?

Spatial data mining je proces pokušaja pronalaženja uzoraka u geografskim podacima. Najčešće korišten u maloprodaji, izrastao je iz područja rudarenja podataka, koje se u početku usredotočilo na pronalaženje obrazaca u tekstualnim i numeričkim elektroničkim informacijama. Mining prostornih podataka smatra se kompliciranijim izazovom od tradicionalnog rudarenja zbog poteškoća povezanih s analizom objekata s konkretnim postojanjem u prostoru i vremenu.

Kao i kod standardnog rudarenja podataka, rudarenje prostornih podataka prvenstveno se koristi u svijetu marketinga i maloprodaje. To je tehnika za donošenje odluka o tome gdje otvoriti kakvu trgovinu. Može pomoći u donošenju tih odluka obradom već postojećih podataka o tome koji čimbenici motiviraju potrošače da idu na jedno mjesto, a ne na drugo.

Recimo da Ashley želi otvoriti noćni klub u određenom gradskom bloku. Kad bi imala pristup odgovarajućim podacima, mogla bi upotrijebiti rudarenje prostornih podataka kako bi saznala koji prostorni čimbenici čine noćne klubove uspješnim. Mogla bi postaviti pitanja poput: Hoće li više ljudi dolaziti u klub ako je javni prijevoz u blizini? Koja udaljenost od drugih mjesta za noćni život povećava pokroviteljstvo? Je li blizina benzinskih postaja plus ili minus?

Ashley bi također mogla htjeti osigurati da ljudi koji dolaze u njezin noćni klub stignu u ravnomjernoj raspodjeli tijekom pojedine večeri. Također bi mogla koristiti prostorno rudarenje podataka – možda točnije, prostorno-vremensko rudarenje podataka – da otkrije kako se ljudi kreću gradom u određeno vrijeme. Isti postupak mogao bi se primijeniti na pokroviteljstvo u različitim noćima u tjednu.

Poteškoće ove metode rezultat su složenosti svijeta izvan interneta. Dok su prošli napori u rudarenju podataka obično imali baze podataka zrele za analizu, inputi dostupni za rudarenje prostornih podataka nisu mreže informacija već karte. Ove karte imaju različite vrste objekata kao što su ceste, stanovništvo, poduzeća i tako dalje.

Utvrđivanje je li nešto “blisko” nečemu drugom prelazi iz diskretne u kontinuiranu varijablu. To uvelike povećava složenost potrebnu za analizu. Nevjerojatno, ovo je jedna od jednostavnijih vrsta odnosa dostupnih nekome tko pokušava rudariti prostorne podatke.
Spatial data mining također se suočava s problemom lažnih pozitivnih rezultata. U procesu pretraživanja podataka u potrazi za odnosima, pojavit će se mnogi očiti trendovi kao posljedica statističkih lažnih pozitivnih rezultata. Ovaj problem postoji i za zadatak rudarenja jednostavnije baze podataka, ali je pojačan veličinom podataka dostupnih rudaru podataka. U konačnici, trend identificiran rudarenjem podataka treba potvrditi kroz proces objašnjenja i dodatnog istraživanja.