Konsenzus sekvenca je skup proteina, ili nukleotida u deoksiribonukleinskoj kiselini (DNA), koji se redovito pojavljuje. DNK se sastoji od nukleotida, a svaki nukleotid se sastoji od fosfata, šećera i dušikove baze. Dušične baze mogu biti adenin (A), timin (T), gvanin (G) i citozin (C). Slijed ovih kemijskih baza određuje genetski kod organizma. Genetski kod je poput upute na temelju koje se organizam gradi i održava. Molekularni biolozi često koriste statistiku kako bi predvidjeli lokaciju sekvenci ili razumjeli gdje se određene molekule nastoje vezati. Formule se mogu koristiti za predstavljanje mjesta gdje sekvence aminokiselina ostaju iste i mjesta na kojima se razlikuju. U slučaju konsenzus promotorske sekvence, na primjer, određeni tip enzima može se vezati na mjesta slično sekvenciranih proteina.
Genetičari, poput istraživača u mnogim znanstvenim disciplinama, često koriste zamjene kako bi pojednostavili složene sustave. U tijelu postoji toliko mnogo baza i gena aminokiselina da ih znanstvenici ne mogu prebrojati osim ako ne postoji neki opći sustav za to. Konsenzusni slijed može se pojaviti na mnogim mjestima u DNK, kao iu raznim živim bićima. Sličnosti i razlike koje se obično javljaju mogu se naznačiti formulom.
Statistički, znanstvenici mogu klasificirati genetske sekvence kako bi potražili uzorke. Obrasci koji se ponavljaju, zvani motivi sekvence, općenito se koriste za predstavljanje genetskih područja koja kontroliraju specifične biološke procese. Konsenzus sekvence također mogu ponuditi uvid u to kako se proteini sintetiziraju ili kako se molekule vode unutar stanice.
U zapisu konsenzusnog slijeda, položaj nekih nukleotida može pokazati da su oni uvijek na predstavljenom mjestu. Također se može naznačiti da jedan ili drugi nukleotid može biti tamo. U ovom slučaju, općenito se ne navodi koliko se često aminokiselina pojavljuje umjesto druge. Grafički model se ponekad koristi za označavanje ove učestalosti, povećanjem ili smanjenjem veličine simbola. Neki softverski programi mogu automatski generirati logotipe sekvenci.
Često se konsenzusni slijed podudara s prepoznatim mjestom za vezanje proteina. Za točan prikaz sekvenci na genomu, često se koriste matematičke formule. To uključuje statističke formule kao što su logaritmi i numeričke vrijednosti, koje mogu biti pozitivne ili negativne, za predstavljanje lokacije genetskih informacija. Na taj se način mogu analizirati procesi u genomu za normalne biološke funkcije, kao i oni koji se odnose na bolesti.
Matematički prikazi konsenzusnog slijeda općenito daju model uzoraka DNK i aminokiselina. Točna slika se obično ne daje. Slijedovi, međutim, mogu pomoći znanstvenicima u povezivanju funkcionalnih aspekata različitih dijelova genoma s evolucijskim obrascima organizama.