Arhitektura skladišta podataka dizajn je koji obuhvaća sve aspekte skladištenja podataka za poslovno okruženje. Skladištenje podataka je stvaranje središnje domene za pohranu složenih, decentraliziranih podataka poduzeća u logičku jedinicu koja omogućuje rudarenje podataka, poslovnu inteligenciju i sveukupni pristup svim relevantnim podacima unutar organizacije. Arhitektura skladišta podataka uključuje sve zahtjeve za izvješćivanje, upravljanje podacima, sigurnosne zahtjeve, zahtjeve za širinom pojasa i zahtjeve za pohranu.
Prilikom izrade arhitekture skladišta podataka, važno je razbiti arhitekturu na specifične domene koje se spajaju u holistički konačni dizajn. Ovaj dizajn treba smatrati nacrtom za arhitekturu podataka poduzeća. Konkretno, nekoliko primarnih područja treba razviti kada se razmatra arhitektura skladišta podataka. Ta područja su pristup izvornom sustavu, proces scenskog područja, proces obogaćivanja podataka, arhitektura podataka, proces poslovne inteligencije i zahtjevi za pohranu.
Skladištenje podataka zahtijeva prijenos izvornih podataka iz transakcijske ili baze podataka zapisa u skladište podataka. Ovaj proces je pojednostavljen u termin Extract Transform and Load (ETL), koji u osnovi obuhvata područja pristupa izvornom sustavu, obogaćivanja podataka i arhitekture podataka. Radi jasnoće, bolje je detaljno osmisliti ova arhitektonska područja, koja ocrtavaju kako će se postići ETL proces. Iako su neki podaci potrebni iz izvornih sustava, svi podaci nisu poželjni jer bi preopteretili skladište poduzeća. Primarna područja zabrinutosti pri rješavanju sloja izvornog sustava su metodologije pristupa podacima, podaci koji se zahtijevaju od izvornog sustava i zahtjevi za osvježavanje.
Sljedeći arhitektonski sloj skladištenja podataka koji treba uzeti u obzir je proces scenskog područja. Kako će većina podataka iz izvornih sustava zahtijevati provjeru valjanosti i čišćenje podataka, važno je stvoriti odredišnu zonu u kojoj će izvorni podaci biti smješteni prije učitavanja u sloj poslovnih pravila skladišta podataka. Polazno područje održava izvore sirovih podataka iz izvornih sustava koji su obično vremenski označeni kako bi se osigurala nedavnost podataka.
Proces obogaćivanja podataka ili poslovnih pravila je mjesto gdje se podaci čiste kako bi se postigao željeni rezultat skladišta podataka. Dobar primjer ovog pristupa čišćenju je korištenje alata za čišćenje adresa; u slučaju da izvorni sustav ima netočne podatke, proces obogaćivanja podataka pokrenut će adresu iz skupa sirovih podataka u sustav poslovnih pravila koji bi ispravio nevažeće adrese. To je također vrijeme kada se netočni podaci brišu ili mijenjaju kako bi se osigurala potpunost unutar skladišta podataka.
Sljedeći sloj koji treba uzeti u obzir je sloj arhitekture podataka. Ovo područje je mjesto gdje se dovršava pravi dizajn ili shema skladišta podataka poduzeća. Skladištenje podataka nije kombinacija svih skupova podataka unutar poduzeća, već je to novodefinirana baza podataka izgrađena kako bi se omogućio pregled svih poslovnih subjekata unutar poduzeća.
To zahtijeva da arhitektura podataka odgovori na pitanja koja će postaviti poslovanje u području poslovne inteligencije i rudarenja podataka. Kreiranjem podatkovne arhitekture na ovaj način, skupovi sirovih podataka će se transformirati u tablice činjenica koje će korisnicima omogućiti izvođenje ad-hoc izvješćivanja o cijelom pogledu poduzeća, a ne o specifičnoj bazi podataka. Ovo je također područje koje će održavati metapodatke o podacima iz sirovog sustava, koji mogu uključivati naziv izvornog sustava ili primarne ključeve.
Sljedeće područje koje treba razmotriti je poslovna inteligencija i zahtjevi za izvješćivanjem. Ovaj sloj se može smatrati zahtjevom za skladištenje podataka prema korisniku. Obično ovo područje sadrži pripremljena izvješća, mogućnost ad-hoc izvješćivanja i poslovne ploče ili upozorenja. Slojevi poslovne inteligencije obično dobivaju najviše pažnje, jer je to jedina komponenta koja je okrenuta prema van unutar skladišta podataka.
Posljednji sloj za razmatranje su ukupni zahtjevi za pohranu podataka i održavanje. Kako skladište podataka nastavlja rasti i širiti se, pohranom podataka baze korisnika mora se strogo upravljati i održavati. Dodatno, tijekom izrade arhitekture skladišta podataka, dizajn bi trebao napraviti realne procjene o tome što će biti potrebno od kapaciteta pohrane podataka, kao i pojasa s kapacitetom pristupa podacima. Ovi zahtjevi bit će kritični kako se skladište podataka naširoko koristi u cijelom poduzeću.