Prljavi podaci izraz je koji se koristi za opisivanje bilo koje vrste elektroničkih podataka koji su zastarjeli, nepotpuni ili na neki drugi način nisu točni. Podaci ove vrste mogu nastati zbog pogrešaka u unosu podataka, neuspjeha da se podaci redovito ažuriraju ili čak unosa istih podataka više puta. Ponekad su netočni podaci ništa drugo do pogreške u interpunkciji u tekstu elektroničkih dokumenata. U drugim slučajevima, prljavi podaci mogu biti informacije koje namjerno dovode u zabludu, kao što su pokušaji modificiranja računovodstvenih zapisa kako bi se ulagačima i drugima predstavila specifična slika.
Uglavnom, gomilanje prljavih podataka u bilo kojoj vrsti baze podataka je nenamjerno. Pojedinci koji unose nove informacije u bazu podataka mogu pogrešno napisati riječi, izostaviti interpunkciju koja je važna za razumijevanje namjere teksta ili ne slijediti određenu strategiju oblikovanja. U situacijama ovog tipa, ispravljanje netočnih informacija je relativno jednostavan proces koji ne zahtijeva ništa više od izmjene netočnog teksta i spremanja promjena. Poduzeća ponekad upravljaju ovim postupkom lektoriranjem podataka nakon što su uneseni i potrebnim ažuriranjem.
Do prljavih podataka može doći i zbog neuspjeha ažuriranja postojećih zapisa kada se informacije promijene. Na primjer, ako prodavači ne uspiju ažurirati korisničke datoteke kada dođe do kadrovskih promjena kod određenog kupca, te datoteke više nisu točne i smatraju se prljavim. Kao i kod ispravljanja pravopisnih i interpunkcijskih pogrešaka, odvajanje vremena za uklanjanje zastarjelih informacija i njihovu zamjenu trenutnim podacima pomaže u povećanju ukupne upotrebljivosti baze podataka.
Postoje situacije u kojima je stvaranje prljavih podataka namjerno. Tvrtke mogu odlučiti izostaviti određene informacije iz baze podataka kako bi stvorile specifičnu percepciju u vezi s financijama, kao što je isticanje iznosa ostvarenog prihoda za određeno razdoblje, ali odlučiti ne unositi podatke koji se odnose na iznos prikupljenih prihoda za isto razdoblje. U ovoj vrsti prljavih podataka, informacije koje se prezentiraju su točne koliko je to moguće, ali se smatraju nepotpunima.
Kod nekih vrsta prljavih podataka odluka može biti da ne odvojite vrijeme i trud za ispravke. To je uobičajeno kada netočni podaci nemaju nikakvog utjecaja na sposobnost poslovanja da ispravno funkcionira ili ne predstavlja potencijal za izazivanje velike nevolje. To znači da gotovo svaki entitet koji održava neku vrstu baze podataka vjerojatno ima barem malo prljavih podataka prošaranih drugim informacijama koje su aktualne i točne.