Genom je skup cjelokupnog genetskog materijala prisutnog u jednom organizmu. Kako slijed i struktura ovog genetskog materijala pokreću cijeli biološki život, znanstvenici su vrlo zainteresirani otkriti čemu sve služe. Baza podataka genoma je unakrsna zbirka informacija o jednom ili više organizama, tako da jedan znanstvenik može pogledati sve dostupne genetske informacije kako bi mu pomogao u istraživanju.
Genomi su vrlo složeni i sadrže milijarde baza u slijedu informacija. Računalne baze podataka, dakle, jedini su praktičan način organiziranja detalja na jednom mjestu. Općenito, oni su dostupni kao online baze podataka za znanstvena istraživanja. Relativno novo područje znanosti, nazvano bioinformatika, pojavilo se kako bi usavršilo način na koji se biološki podaci mogu tumačiti putem računalnih sustava.
Baze genoma sadrže slijed gena organizma ako je poznat cijeli niz. Inače, može sadržavati djelomične sekvence. Na primjer, sekvencionirani su genomi čovjeka, miša i muhe Drosophile. Kada je poznat slijed genoma, genetičari mogu identificirati određene gene u genomu. Svaki gen je uputa za jedan određeni stanični proizvod.
Ako gen ima mutaciju, ima drugačiji slijed od normalnog, funkcionalnog gena. Mutacije mogu biti korisne i proizvesti korisnu karakteristiku u mutiranom organizmu. Oni također ne mogu utjecati na proizvod, ili mogu biti štetni za normalno funkcioniranje organizma. Mnoga su medicinska stanja, na primjer, posljedica mutacija određenog gena.
Mutacije se također mogu koristiti za izračunavanje koliko je određena vrsta blisko povezana s drugom, budući da se tijekom vremena nakuplja više mutacija. Pojedinci također mogu varirati u slijedu genoma, pogotovo jer veliki dijelovi genoma nisu geni i ne kodiraju za bilo koji esencijalni stanični proizvod. Baza podataka genoma sadrži slijed iz organizma koji je određen kao standard, ali će postojati mnoge manje razlike između proizvoljno odabranog standarda i ostalih pojedinaca u vrsti.
Unatoč prisutnosti mnogih razlika, geni su prepoznatljivi kroz sekvence. Ako genetičari znaju što određeni gen radi u jednom organizmu, onda gen sa sličnim slijedom u drugoj životinji najvjerojatnije obavlja istu funkciju. Genetičari mogu koristiti bazu podataka genoma kako bi identificirali gen koji proučavaju ili kako bi saznali što gen radi.
Svaka baza podataka genoma je pretraživa. Obično znanstvenici mogu pretraživati bazu podataka na jedan od nekoliko različitih načina. Obično on ili ona može unijeti sekvencu gena koju je sekvencirao. Zatim baza podataka pronalazi jednu ili više sličnih sekvenci za usporedbu.
Jednostavniji način pretraživanja baze podataka uključuje traženje ključne riječi gena, kao što je naziv gena. Vlasti kao što je Američko nacionalno tijelo za biotehnološke informacije (NCBI) mogu sekvencijama dati različite referentne brojeve, a genetičar također može pretraživati bazu podataka genoma koristeći jedan od ovih identifikatora. On ili ona također mogu suziti rezultate koristeći više parametara pretraživanja. Unakrsne informacije značajka su većine baza podataka genoma, a rezultat jedne sekvence također će korisniku baze podataka pružiti korisne veze za više genetskih informacija. Kao i informacije o određenom nizu, mnoge baze podataka pružaju vizualni prikaz slijeda i značajnih značajki tog područja.
Različiti organizmi mogu imati specifične baze podataka genoma, ali neke veće baze podataka sadrže više od jedne vrste. Različiti autoriteti kontroliraju različite dostupne baze podataka, tako da sve baze podataka mogu koristiti različite formate i mogućnosti pretraživanja. Neki primjeri tih tijela uključuju NCBI, Europski institut za bioinformatiku ili čak pojedina sveučilišta.