Sintaksa HyperText Markup Language (HTML) je formalna definicija onoga što riječi imaju značenje za jezični tumač i načina na koji ih je potrebno rasporediti i napisati da bi bile ispravno interpretirane. Uglavnom, osnovna HTML sintaksa se sastoji od riječi koje su zatvorene u znakovima više od i manje od, pri čemu je cijeli niz u zagradama poznat kao oznaka. Svaka oznaka može sadržavati samo jednu riječ, može biti par oznaka koje označavaju početak i kraj bloka teksta ili drugih elemenata, ili čak može sadržavati više atributa odvojenih razmacima, kao što je naziv slike ili klase definicija. HTML sintaksa je prilično labava u usporedbi s drugim programskim jezicima, jer je osnovni HTML namijenjen kao označni jezik koji se koristi za oblikovanje dokumenata, iako neka složenija proširenja HTML-a, kao što su kaskadni stilski listovi (CSS), imaju daleko strukturiraniju sintaksa.
HTML sintaksa je dizajnirana tako da se oznake mogu umetnuti u tekstualni dokument kako bi se osiguralo oblikovanje ili veze ili za umetanje slika koje se mogu vidjeti kada HTML preglednik analizira dokument, kao što je web preglednik. Iz tog razloga, HTML oznake su definirane kao uklopljene u znakove veće od i manje od kako bi se razlikovale od ostatka teksta u dokumentu. Osim toga, budući da je HTML kod namijenjen označavanju ili modificiranju izgleda teksta u dokumentu, većina oznaka okružuje tekst koji mijenjaju.
To se može vidjeti s osnovnom HTML oznakom za podebljani tekst. Tekst koji će biti prikazan podebljanim slovima okružen je s dvije oznake, pri čemu prva jednostavno sadrži slovo B u zagradama, a završna oznaka sadrži kosu crtu i slovo B u zagradama. Kosa crta naprijed u HTML sintaksi označava da je oznaka završna oznaka, što znači da će završiti blok koji je prethodno započet početnom verzijom iste oznake. Uz vrlo malo iznimaka, većina HTML oznaka sastoji se od parova oznaka otvaranja i zatvaranja.
Ostali elementi koji sadrže HTML sintaksu uključuju oznake koje se koriste za stvarno definiranje svojstava HTML dokumenta. Ove se oznake obično postavljaju na početak HTML dokumenta i određuju opcije kao što je vrsta korištenog kodiranja znakova, posebne značajke prikaza kao što je prikaz znakova zdesna nalijevo za neke jezike ili čak informacije o bilo kojem posebnom sadržaju uključenom u datoteka. Ispravna HTML sintaksa također uključuje način na koji su atributi unutar oznake navedeni, kako se neke oznake mogu pojaviti — jer se ne mogu sve ugniježditi unutar drugih — pa čak i načine uključivanja komentara za razvojnog programera koji se neće prikazati kada se stranica pregleda.
Jedna od komplikacija koja se često javlja s upotrebom HTML sintakse je da neke nestandardne, tehnički nepodržane sintakse na kraju postanu široko korištene. To se može dogoditi kada HTML preglednik ili web-preglednik pokuša omogućiti pregled HTML dokumenata koji ne slijede odgovarajuću sintaksu, te umjesto toga automatski kompenziraju i prikažu stranicu. To je uzrokovalo da se neka sintaktička pravila, poput uključivanja oznaka za zatvaranje za određene oznake, obično zanemaruju, unatoč tome što su dio formalne HTML sintakse.