“Proliferacija podataka” je krovni pojam koji se bavi velikim brojem datoteka i količinom podataka koje pohranjuju subjekti kao što su vlade i poduzeća. Ogromna količina podataka koji svakodnevno pristižu znači da ti entiteti trebaju više prostora i hardvera, ali proliferacija podataka ide brže od napretka računala od 2011. Nije važno koja se vrsta informacija pohranjuje – jesu li strukturirane ili nestrukturirane; bitno je samo da se memorija računala zauzima. Pohranjivanje svih ovih podataka može biti teško, što dovodi do dodatnih troškova. Drugi problem s proliferacijom podataka je taj što mreža na kojoj su podaci pohranjeni i svi povezani programi imaju tendenciju usporavanja.
Problem proliferacije podataka nije onaj koji zabrinjava potrošače i prosječne korisnike računala. Dok su prosječni korisnici računala s vremenom zahtijevali više memorije, računala su uspjela napredovati brzinom kako bi zadovoljila te potrebe. Međutim, kada je riječ o poduzećima, vladama i drugim subjektima koji svakodnevno prikupljaju ogromne podatke, može se očitovati problem proliferacije podataka.
Ako prosječnom korisniku računala treba više računalne memorije, obično dobiva veći tvrdi disk. Kada veliki entitet treba više memorije, obično mora dobiti više poslužitelja. Uobičajeno, to ne bi trebalo predstavljati probleme, ali mnogi veliki entiteti u 2011. pohranjuju sve veće količine podataka brzinom koja nadmašuje tehnologiju, a ogroman broj poslužitelja može biti potreban za držanje svega što entitet treba pohraniti. To je zato što računalna tehnologija još nije u stanju napraviti uređaj sposoban držati sve informacije, što znači da veliki subjekt mora nastaviti kupovati i koristiti sve više i više hardvera.
Neki podaci ili problemi odnose se samo na jednu vrstu informacija. Međutim, kada je riječ o proliferaciji podataka, nije važno o kojoj se vrsti podataka radi. Sve dok se memorija računala zauzima velikom brzinom, tada proliferacija podataka postaje problem.
Jedan od mnogih problema s proliferacijom podataka je trošak. Osim troškova dodatnog hardvera za pohranu, tu su i troškovi fizičke pohrane i ljudskih resursa. Poslužitelji se moraju negdje smjestiti i ljudi moraju biti zaposleni za upravljanje poslužiteljima, što rezultira troškovima koji bi teoretski mogli postati preveliki da bi ih subjekt mogao održati i dovesti do ozbiljnog smanjenja dobiti. Drugi problem se odnosi na brzinu mreže, jer začepljenje podataka može dovesti do toga da se programi kreću puno sporije, što znači da zaposlenici mogu raditi manje posla tijekom radnog dana.