Kontrolirani vokabular je koncept u informatici i računalnom programiranju koji uključuje korištenje samo prethodno dogovorenih ili odobrenih pojmova pri izradi relacijskih baza podataka, pretraživih metapodataka ili drugih sustava u kojima se riječi čitljive osobe koriste za označavanje informacija za kasnije pronalaženje. Metodologija korištenja kontroliranog rječnika za klasifikaciju informacija u izravnoj je suprotnosti s konceptom vokabulara prirodnog jezika, u kojem nema dogovorenih pojmova, a sve riječi koje se koriste su umjesto toga povezane ponderiranim odnosima. Uz riječi najviše razine koje se koriste u kontroliranom rječniku, mogu se koristiti i pomoćne riječi kako bi sinonimi ili drugi izrazi koji su čvrsto povezani s pojmom najviše razine mogli potaknuti upotrebu riječi najviše razine. Glavne razlike koje se mjere između sustava prirodnog jezika i sustava kontroliranog rječnika su relevantnost rezultata upita pomoću riječi, količina vraćenih informacija i ukupna upotrebljivost sustava.
Postoje mnogi slučajevi u kojima se zbirka riječi ili pojmova koristi kako bi informacije koje su proizvoljne, koje se stalno mijenjaju ili neorganizirane učinile pristupačnijim korisnicima. Pojmovi za pretraživanje unutar internetske tražilice, korporativna informacijska baza podataka, pa čak i digitalna istraživačka knjižnica, svi su primjeri aplikacija putem kojih se informacije mogu kategorizirati pojmovima metapodataka za razliku od stroge hijerarhijske strukture. Riječi koje se koriste za opisivanje objekta u takvim situacijama grade neku vrstu pretraživog indeksa većeg skupa informacija.
Jedan primjer korištenja kontroliranog rječnika može se vidjeti kada se razmatra sustav arhiviranja za tvrtku. Datoteke moraju biti kategorizirane na način da ih je lako i predvidljivo pronaći. Ako se jedna datoteka bavi automobilima, onda bi se mogla prijaviti pod kategorijom “automobili”. Ako druga osoba također ima datoteku koja se bavi automobilima, bez kontroliranog rječnika, datoteka bi se mogla staviti pod naslov “automobili”, što otežava pronalaženje dviju datoteka jednim pretraživanjem. Kada su kategorije kontrolirane, tada bi se svi dosjei koji se odnose na automobile smjestili pod jedan dogovoreni naslov.
Prednost korištenja kontroliranog rječnika je u tome što su informacije strogo opisane na predvidljiv način. To znači da će svatko tko je svjestan rječnika moći učinkovito i točno tražiti informacije. Komplikacija s vokabularom je, međutim, to što je pojmove za pretraživanje teže, ako ne i nemoguće, generirati automatski i obično zahtijevaju ljudsku intervenciju, što čini velikim zadatkom pretvaranje postojećih baza podataka u korištenje kontroliranog rječnika. Ako vokabular nije dovoljno velik, postoji i mogućnost da jedan upit donese tako veliku količinu informacija da postaje nepraktično sortirati bez upotrebe druge metode upita.