Što je model skladišta podataka?

Model skladišta podataka je primijenjeni oblik modela podataka računalnog sustava. U računalnim sustavima tok podataka se modelira na temelju teoretskih informacija kako bi se testirale sposobnosti i ograničenja sustava. Kada je nastalo skladište podataka, ti isti modeli počeli su nalaziti stvarne fizičke primjene u konstrukciji podataka. To bi bilo slično osobi koja jednostavno radi matematičke probleme, a zatim koristi te jednadžbe za izgradnju nove vrste motora.

Postoji nekoliko različitih ideja iza modela skladišta podataka. Svaki od njih ima svoje jake i slabe strane, kao i tipove podataka kojima je prikladniji za rukovanje. Nije neuobičajeno da nekoliko različitih modela skladišta podataka ili hibridni sustavi koji se oslanjaju na prednosti više vrsta postoje u istom sustavu.

Flat sustav je tip modela skladišta podataka koji bi mnogi korisnici prepoznali kao najlakši. Ovaj način pohrane podataka uključuje međusobno povezane retke i stupce informacija, slično proračunskoj tablici. Iako je ovu metodu ljudima lako čitati, računalima je teže i sporije je u korelaciji.

Model hijerarhijskog skladišta podataka pohranjuje informacije u kontinuiranom nizu razina. Svaka razina sadrži informacije koje ovise o generaciji iznad. Ovo je vrlo slično mrežnom modelu, koji također sadrži niz ovisnih razina. Razlika leži u njihovim ovisnostima – u hijerarhijskom sustavu svaki blok podataka može imati samo jednu višu razinu ovisnosti, ali u mrežnom modelu može imati onoliko koliko im je potrebno. U oba slučaja, jedan blok informacija može se povezati s nekoliko blokova ispod.

Model relacijskog skladišta podataka varijacija je Flat sustava. Podaci se čuvaju u tablicama, slično onima u Flat sustavu, a svaki temeljni dio podataka ima jedinstveni identifikator. Ovaj identifikator putuje zajedno s podacima, osiguravajući jedinstvenost. Na primjer, ako poslodavac ima dva zaposlenika s istim imenom, njihov identifikator bi ih i dalje razdvajao u sustavu. Ovaj identifikator je povezan kroz cijeli sustav—ako sve radi ispravno, svaki put kada bilo što povezano s jedinstvenom informacijom dođe u sustav, to bi bilo u korelaciji s već postojećim informacijama koje se temelje samo na identifikatoru.

Dimenzionalni model temelji se na hijerarhijskom. Jedna se činjenica koristi kao početna točka, a zatim iz nje izviru dodatne informacije koje se odnose na tu činjenicu. Stavka kao što je broj zaposlenika bila bi početna činjenica; tada bi se datumi koji se odnose na tog radnika, kao i plaća ili vrijeme godišnjeg odmora, povezali s tim kad uđu u sustav.
Relacijski i Dimenzionalni modeli skladišta podataka dva su najčešća stila. Postoje i druge vrste skladištenja podataka, ali su manje u usporedbi s ovim. Općenito, novi modeli se izgrađuju iz ravnih, hijerarhijskih ili mrežnih sustava; često su samo jednostavna poboljšanja njihove osnovne metode organiziranja.