Sastavljanje genoma odnosi se na proces uzimanja mnogo malih dijelova genetskog slijeda i njihovog spajanja u koherentnu cjelinu koja predstavlja cijeli genom organizma. Ovo je glavni fokus područja bioinformatike, a za tu svrhu postoje različiti projekti genoma. Sklapanje genoma korišteno je za početak analize genoma mnogih vrsta, uključujući ljude, biljke, životinje i bakterije.
Analiza gena organizma je dug proces, a sastavljanje genoma jedan je od prvih koraka. Mnoge druge metode analize temelje se na uspješnom sklapanju, a identifikacija gena ne može napredovati bez toga. Čak i prije nego što se geni pronađu, uspješan sklop genoma još uvijek može generirati mnogo korisnih informacija za kasniju analizu, uključujući veličinu genoma, njegovu strukturu i njegov opći sastav.
Proces sastavljanja genoma je poput sastavljanja slagalice bez slike ili korisnih oblika kao vodiča. Kada se suočimo s prvim dijelovima genoma, nazvanim sirovo čitanje, rijetko postoje indikacije kamo određeni dio ide, ili čak kako je orijentiran. Svaki dio je kodiran na sličan način s četiri baze DNK, skraćeno A, C, G i T. Genom se može zbiti u jedan veliki kromosom ili podijeliti na više. Također nema jamstva da neka od sirovih očitanja nisu duplikati istog područja genoma, što bi značilo da postoji manje jedinstvenih informacija nego što se čini na prvi pogled.
Opće znanje o strukturi genoma je neprocjenjivo pri započinjanju procesa sastavljanja. Iako su genomi između vrsta izrazito različiti, postoje određena pravila koja slijede određene vrste genoma, a ona se mogu primijeniti kada se sastavlja drugi genom te iste vrste. Na primjer, ako određena vrsta organizma uvijek ima određeni uzorak u blizini gdje se nalaze geni, razumno bi se moglo pretpostaviti, kada se sastavlja drugi sličan organizam, da bi pronalazak takvog uzorka signalizirao gen u blizini. U većoj skali, mnogi bakterijski genomi imaju jedan kružni kromosom, pa bi bilo razumno predvidjeti da će se sva neobrađena očitanja nove bakterije nekako složiti na jednom kromosomu. Primjena općeg genetskog znanja na ovaj način može omogućiti istraživaču da počne razumjeti potencijalno stotine tisuća podataka.
Postoje mnoge druge metode koje se mogu koristiti u sastavljanju genoma, uključujući računska predviđanja i ručne usporedbe. Bez obzira na metodu, sastavljanje genoma je velik posao koji često oduzima vrijeme i težak. Budući da je to osnova za mnoge buduće genetske analize organizma, malo je mjesta za pogreške.