Što je optimizacija kapaciteta?

Optimizacija kapaciteta sastoji se od različitih, a opet često komplementarnih metoda pohrane podataka i smanjenja potreba za pohranom prilikom izrade sigurnosnih kopija. Poduzeća i pojedinačna poduzeća često izrađuju višestruke sigurnosne kopije posla, a potreba za pohranom, indeksiranjem i dohvaćanjem podataka zahtijeva optimizaciju kako bi se smanjila količina hardvera i rezultirajućih troškova potrebnih za rukovanje svim tim podacima. Kada se izrađuju sigurnosne kopije, često dolazi do viškova i samo malih promjena između sigurnosnih kopija. U svjetlu redundancije, strategije optimizacije kapaciteta osmišljavaju rješenja koja smanjuju troškove pohrane i veličinu sigurnosnih kopija smanjenu u odnosu na izvorne za čak 95 posto. Optimizacija kapaciteta ponekad je poznata kao optimizacija propusnosti kada se koristi u aplikacijama za širokopojasne mreže (WAN) kako bi se omogućila veća propusnost pri prijenosu i primanju podataka na mreži.

Kompresija podataka općenito koristi tehnike kodiranja za smanjenje veličine podataka koji se pohranjuju ili prenose. Ovisno o tome jesu li neki podaci odbačeni u procesu, mogu se okarakterizirati kao podaci s gubitkom — podaci koji se gube — ili bez gubitaka. Skeniranje podataka u potrazi za redundancijama ili ponavljanjem i njihova zamjena s unakrsno referenciranim i indeksiranim tokenima omogućuje velika smanjenja količine potrebnog prostora za pohranu. Šifarnici za potiskivanje podataka usmjeravaju akceleratore u komunikaciji za sinkronizaciju i korištenje memorije ili tvrdog diska za pisanje povijesti kompresije u spremište za pohranu omogućavajući proxy protokola za kontrolu prijenosa (TCP) da se koristi kao međuspremnik paketa ili sesija tako da brzine prijenosa nisu smanjena. Druga metoda kompresije podataka smanjuje veličinu podataka u stvarnom vremenu dok idu na prvu sigurnosnu kopiju, a time i daljnjom optimizacijom, što rezultira većom uštedom u prostoru i vremenu.

Korištenje tradicionalnih sredstava kompresije može smanjiti veličinu pohranjenih podataka u omjeru 2:1; korištenje optimizacije kapaciteta može povećati ovo smanjenje na čak 20:1. Traženje redundancije u nizovima bajtova u prozorima za usporedbu i korištenje kriptografskih hash funkcija za jedinstvene sekvence u algoritmima za deduplikaciju omogućuje segmentiranje tokova podataka. Ovim segmentima streama se zatim dodjeljuju jedinstveni identifikatori i indeksiraju za dohvat. Na taj se način spremaju samo novi skupovi podataka prije daljnjeg komprimiranja korištenjem standardnih algoritama kompresije. Neke metode deduplikacije temelje se na hardveru, a njihovo kombiniranje s tradicionalnim softverskim algoritmima kompresije omogućuje funkcijama da proizvedu značajnu uštedu prostora i vremena.

Mnogi pristupi se usredotočuju na smanjenje troškova i prostora kapaciteta za pohranu kako bi se smanjili troškovi povezani s infrastrukturom za pohranu, a slična se razmatranja pojavljuju u WAN scenarijima. Sloj poznat kao transportni sloj mora postojati između aplikacija i temeljnih mrežnih struktura tijekom prijenosa, omogućujući da se podaci šalju i primaju učinkovito i brzo, no transportni sloj je i dalje onaj koji je stvoren 1981. godine kada je TCP prvi put stvoren i radio pri 300 boda. stopa. Stoga akceleratori koriste TCP proxyje, smanjujući gubitke tijekom prijenosa i dajući potvrde kako bi povećali veličinu paketa koristeći napredne metode kompresije podataka za isporuku više podataka po vremenskom segmentu. Kako bi se prevladale prepreke tijekom prijenosa, ove tehnike kohezivno surađuju kako bi poboljšale performanse aplikacija i smanjile količinu potrošnje propusnosti.