Kompresija podataka bez gubitaka je računalna metoda pohranjivanja datoteka i njihova kombiniranja u arhive koja zauzima manje fizičkog prostora u memoriji nego što bi datoteke inače bez gubitka informacija koje podaci sadrže u procesu. Za razliku od toga, kompresija s gubitkom smanjuje veličinu datoteke s aproksimacijom podataka, a vraćanje je slično faksimilu izvornog sadržaja datoteke. Algoritmi koji se koriste za kompresiju podataka bez gubitaka u biti su skup pojednostavljenih pravila ili uputa za kodiranje informacija korištenjem manje bitova memorije, dok i dalje zadržavaju mogućnost vraćanja podataka u izvorni format bez izmjena.
Neke uobičajene vrste datoteka koje koriste kompresiju podataka bez gubitaka uključuju računalnu zip arhivu International Business Machines (IBM) i arhive gzip datoteka bazirane na Unixu. Također se koriste formati slikovnih datoteka kao što su format za razmjenu grafike (GIF), prijenosne mrežne grafike (PNG) i Bitmap (BMP) datoteke. Algoritmi kompresije podataka također se razlikuju ovisno o vrsti datoteke koja se komprimira, s uobičajenim varijacijama za tekstualne, audio i izvršne programske datoteke.
Dvije glavne kategorije algoritama za kompresiju podataka bez gubitaka temelje se na statističkom modelu ulaznih podataka i modelu mapiranja nizova bitova u datoteci podataka. Upotrijebljeni rutinski statistički algoritmi su Burrows-Wheelerova transformacija (BWT), algoritam Abrahama Lempela i Jacoba Ziva (LZ77) objavljen 1977. godine i metoda predviđanja djelomičnim podudaranjem (PPM). Algoritmi za mapiranje koji se često koriste uključuju Huffmanov algoritam kodiranja i aritmetičko kodiranje.
Neki od algoritama su alati otvorenog koda, a drugi su vlasnički i patentirani, iako su patenti na nekima također sada istekli. To može dovesti do toga da se metode kompresije ponekad primjenjuju na pogrešan format datoteke. Zbog činjenice da su određene metode kompresije podataka međusobno nekompatibilne, pohranjivanje mješovitih datoteka često može degradirati komponentu datoteke. Na primjer, slikovna datoteka s komprimiranim tekstom može pokazati pogoršanje čitljivosti teksta nakon vraćanja. Skeneri i softver koji koriste gramatičku indukciju mogu izdvojiti značenje iz teksta pohranjenog zajedno sa slikovnim datotekama primjenom onoga što je poznato kao latentna semantička analiza (LSA).
Drugi oblik metode algoritma za mapiranje za kompresiju podataka bez gubitaka je korištenje univerzalnog koda. Fleksibilniji za korištenje od Huffmanovog kodiranja, ne zahtijeva poznavanje maksimalnih cjelobrojnih vrijednosti prije vremena. Međutim, Huffmanovo kodiranje i aritmetičko kodiranje proizvode bolje stope kompresije podataka. U tijeku su i napori da se proizvedu univerzalne metode kompresije podataka koje bi stvorile algoritme koji dobro funkcioniraju za različite izvore.