Što je kompresija datoteka?

Kompresija datoteka metoda je koju koriste računala za smanjenje veličine elektroničke datoteke ili grupe datoteka na najmanju moguću veličinu. ZIP datoteke su uobičajen primjer kompresije datoteka. Postoje mnoge tehnike koje računalni programi koriste za komprimiranje datoteka, ali najčešća metoda je zamjena ponovljenih sekvenci manjim sekvencama. Računala to čine katalogizirajući prvu instancu i pozivajući se na nju u sljedećim instancama. Na primjer, u rečenicama prije ove, slova “compress” pojavila su se tri puta. Računalo ih može komprimirati katalogiziranjem prve instance i izjednačavanjem svih sljedećih instanci s “&cmp” – čime se smanjuje broj potrebnih slova ili znakova i smanjuje veličina datoteke. Tijekom velike datoteke, takva zamjena može uštedjeti mnogo prostora. Treba napomenuti, međutim, da korisnik to ne vidi — računalo obavlja sav posao u pozadini.

Kako bi pratili skraćene zamjene, računalni programi također stvaraju rječnik za komprimiranu datoteku. U svijetu sažimanja datoteka, rječnik je popis izvornih fraza i njihovih zamjena. Međutim, ovaj je rječnik uključen u veličinu datoteke, tako da će također zauzimati prostor, smanjujući količinu prostora koji se štedi kompresijom. Iz tog razloga obično je manje učinkovito komprimirati jednu malu datoteku od velike datoteke ili grupe.

Programi koji izvode kompresiju datoteka rade na malo drugačije načine. Te su razlike uglavnom rezultat nečega što se zove algoritam. Algoritam je matematička konstrukcija koja traži ponavljanja u datotekama i stavlja jednostavne reference. Programeri stvaraju algoritme kompresije i definiraju obrasce i zamjene koje će se koristiti za kompresiju. Odstupanja mogu utjecati na učinkovitost kompresije. Na primjer, u frazi “bila su to najbolja vremena, bila su to najgora vremena” ponavljaju se sekvence “bilo je to” i “st of times”. Programer može odabrati zamijeniti svaki cijeli izraz ili možda zamijeniti “to” pojedinačno i “puta” pojedinačno. Ove male razlike u algoritmima razlog su zašto neki programi za kompresiju datoteka rade bolje na nekim vrstama datoteka od drugih.

Neke vrste komprimiranih datoteka su samoraspakirajuće, što znači da se automatski otvaraju kada ih korisnik klikne – za njihovo dekomprimiranje nisu potrebni vanjski programi. Kako bi napravio ove datoteke, izvorni program kompresije mora dodati dodatni kod komprimiranoj datoteci. Iz tog razloga, samoraspakirajuća komprimirana datoteka često je veća od iste datoteke ako je normalno komprimirana. To se obično smatra dobrim kompromisom za tvrtke koje izdaju programe za instaliranje na kućna računala. Time što se datoteka sama raspakuje, omogućuje kućnom korisniku da preskoči korak i čini vjerojatnijim da će se softver instalirati. Za dekomprimiranje datoteka koje se ne samoraspakiraju, brojni programi trećih strana dostupni su za preuzimanje na Internetu.