Što je Data Stream Mining?

Mining toka podataka je strategija koja uključuje identificiranje i izdvajanje informacija iz aktivnog toka podataka. S ovim pristupom, ideja je povući podatke bez stvaranja bilo kakvog prekida u samom streamu, što omogućuje drugima da također koriste podatke čak i dok se ekstrakcija odvija. Ova vrsta rudarenja toka podataka može uključivati ​​sve vrste podataka, od prijenosa glasa do videa preko Interneta, pa čak i do svakodnevnih zadataka poput podizanja novca s bankovnog računa pomoću bankomata ili telefonskog razgovora.

Jedna od karakteristika rudarenja toka podataka je sposobnost preciznog projiciranja ili predviđanja kako locirati željenu informaciju i koja vrsta alata za otkrivanje znanja će pomoći u lociranju i uspješnom izdvajanju željenih informacija. Na primjer, kada kupac pokrene transakciju pomoću bankomata, programiranje za uređaj pokreće pretragu relevantnih informacija o računu, locira podatke i zatim utvrđuje hoće li iznos transakcije smanjiti stanje računa ispod dopuštenog iznosa, na temelju načina na koji je račun strukturiran. Odatle programiranje može vratiti relevantne podatke korisniku, kao što je dokumentiranje uspješnog završetka zatražene transakcije i pružanje stanja na računu preostalog nakon evidentiranja kredita ili zaduženja uključenih u transakciju.

Drugi uobičajeni primjer rudarenja toka podataka je osnovno pretraživanje weba pomoću preglednika. S ovom aplikacijom krajnji korisnik unosi vrijednosti pretraživanja u polje, a softver koji pokreće preglednik nastoji protumačiti te vrijednosti i vratiti podatke koji su relevantni za kriterije pretraživanja. Ovisno o tome kako je preglednik konfiguriran, to također može uključivati ​​značajku koja nastoji predvidjeti namjeru pretraživanja koja se provodi i ponuditi dodatne riječi ili izraze koji mogu pomoći da se precizira pretraživanje više prema korisnikovom ukusu. Nakon što je korisnik odredio frazu za pretraživanje, preglednik vraća rezultate prema rangiranju, koristeći algoritme koji su relevantni za konfiguraciju samog preglednika.

Jedna od glavnih prednosti rudarenja toka podataka je mogućnost pristupa i pretraživanja podataka bez zapravo zabrane drugima da koriste te iste podatke. Budući da se tokovi podataka stalno ažuriraju, rezultati ekstrakcije mogu se s vremena na vrijeme promijeniti. Na primjer, provođenje web pretraživanja pomoću određene fraze za pretraživanje može dati jedan skup rezultata danas, ali dati nešto drugačiji skup rezultata sutra, na temelju novih informacija koje su ušle u tok podataka i kako tražilica rangira te podatke.