Pojam “skup podataka” odnosi se na povezani skup vrijednosti dobivenih iz centralizirane baze podataka. Podaci mogu biti bilo što, od informacija o lancu opskrbe do evidencije zaposlenika. Podaci se mogu generirati automatski ili ručno za analizu pomoću cijelog skupa podataka ili podskupa vrijednosti. Softver baze podataka dizajniran je za rukovanje različitim funkcijama povezanim s skupovima podataka, uključujući sinkronizaciju i provjeru informacija.
U vrlo osnovnom smislu, svaki skup podataka prikupljen u svrhu analize je zbirka podataka. Način prikupljanja podataka može utjecati na točnost vrijednosti unutar skupa, a time i na ishod analize. Ako je skup podataka dio jednostavnog kvantitativnog eksperimenta koji ne uključuje veliki skup podataka, ručno prikupljanje podataka može biti prilično pouzdano. Naprotiv, ako je skup podataka velik, proces automatskog prikupljanja podataka bit će najtočniji i najprecizniji.
Točnost i preciznost vrijednosti sadržanih u skupu podataka uvijek je važna, ali može biti imperativ za neke industrije koje se oslanjaju na praćenje lanca skrbništva u lancu opskrbe. Globalna mreža za sinkronizaciju podataka (GSDN) certificira skupove podataka i olakšava proces sinkronizacije podataka izvodeći godišnju reviziju na svim GDSN certificiranim skupovima podataka. Podaci lanca opskrbe koji su zarobljeni u GDSN certificiranom skupu podataka vezani su za globalni broj lokacije (GLN) i globalni broj trgovinske jedinice (GLIT). Ova dva broja koriste se za identifikaciju relevantnih lokacija i povezanih artikala za trgovinu, odnosno, dok predmet prolazi kroz opskrbni lanac od proizvođača do potrošača.
U drugim slučajevima, bazama podataka automatski pristupa softver baze podataka dok se računalo diže ili tijekom procesa instalacije ili nadogradnje. Ovi procesi uključuju prijenos i provjeru informacija između baza podataka. Podaci koji se prenose i provjeravaju je zbirka podataka. Ako se tijekom procesa pojavi pogreška podatkovnog skupa, može postojati problem s podacima, kao što je oštećena datoteka za pokretanje, netočne postavke na tvrdom disku ili neispravan tvrdi disk.
Za prilagođenu bazu podataka koja sadrži zapise o zaposlenicima ili povijesne podatke o temperaturi, pristup skupu podataka može biti privatan ili zajednički. Privatni bazen ne može vidjeti niti pristupiti nitko drugi osim administratora. Zajedničkom bazenu mogu pristupiti drugi koji mogu dodavati, uređivati ili uklanjati vrijednosti. Podaci se mogu unositi automatski, ručno i uvoziti ili izvoziti iz proračunske tablice. Web-baziranim bazenom obično manipulira administrator, ali se dijeli tako da online korisnici mogu pregledavati i izvoziti podatke u različite svrhe.