Čišćenje podataka, također poznato kao čišćenje podataka, je proces kojim se osigurava da je skup podataka točan i točan. Tijekom ovog procesa provjerava se točnost i dosljednost zapisa, te se po potrebi ispravljaju ili brišu. To se može dogoditi unutar jednog skupa zapisa ili između više skupova podataka koje je potrebno spojiti ili će raditi zajedno.
Jednostavan proces
U svom najjednostavnijem obliku, čišćenje podataka uključuje osobu ili osobe koje čitaju niz zapisa i provjeravaju njihovu točnost. Ispravljaju se pogreške u pisanju i pravopisu, pogrešno označeni podaci su ispravno označeni i arhivirani, a nepotpuni unosi ili unosi koji nedostaju su dovršeni. Ove operacije često čiste zastarjele ili nepopravljive zapise kako ne bi zauzimali prostor i uzrokovali neučinkovite operacije.
Složen proces
U složenijim operacijama čišćenje podataka može se izvesti računalnim programima. Ovi programi mogu provjeravati podatke različitim pravilima i postupcima o kojima odlučuje korisnik. Program se može postaviti tako da izbriše sve zapise koji nisu ažurirani u prethodnih pet godina, ispravi sve pogrešno napisane riječi i izbriše sve duple kopije. Složeniji program mogao bi popuniti grad koji nedostaje na temelju ispravnog poštanskog broja ili promijeniti cijene svih stavki u bazi podataka u drugu vrstu valute.
Prednosti
Čišćenje podataka vrlo je važno za učinkovitost svakog poslovanja ovisnog o podacima. Ako neki od klijenata u bazi podataka nemaju točne telefonske brojeve, primjerice, zaposlenici ih ne mogu lako kontaktirati. Ako klijentove e-adrese nisu ispravno formatirane, kao drugi primjer, automatizirani sustav e-pošte ne bi mogao slati najnovije kupone i posebne ponude. Zadatak čišćenja podataka je osigurati da su podaci unutar sustava ispravni, tako da sustav može koristiti podatke. Netočni ili nepotpuni zapisi nikome nisu od velike koristi.
Kad god dva sustava podataka trebaju raditi zajedno, čišćenje podataka je još važnije. Ako tvrtka ima dvije podružnice koje rade s mnogo istih kupaca, ne samo da podaci u svakoj podružnici moraju biti potpuni i točni, već i dvije podružnice moraju imati podudarne podatke. Kada korisnik ažurira svoj telefonski broj u jednoj poslovnici, podaci u drugoj poslovnici moraju se ažurirati istim informacijama kako bi se osigurala najveća učinkovitost. Čišćenje podataka radi ne samo kako bi se osiguralo da su podaci točni, već i da su dosljedni između različitih zapisa.
Svaki put kada se pohranjuje mnogo podataka, greške će se sigurno uvući u sustav. Cilj čišćenja podataka je minimizirati te pogreške i učiniti podatke što korisnijim i smislenijim. Ako se ovaj proces ne provodi redovito, pogreške i pogreške se mogu zbrajati, što dovodi do manje učinkovitog rada i više komplikacija.