Računalna lingvistika je opće područje koje obuhvaća mnoge aspekte psihologije, lingvistike, logike i informatike. Bavi se pomoći računalima da razumiju jezična pitanja kako bi postali bolji u automatizaciji aspekata prevođenja, generiranja, govora i razumijevanja.
Računalna lingvistika rođena je nakon brojnih neuspjelih pokušaja automatskog prevođenja. Krajem 1940-ih, američka je vlada uvidjela potrebu za strojnim prevođenjem tekstova, posebice ruskih tekstova. Pretpostavljalo se, s obzirom na lakoću s kojom su računala bila prilagođena rješavanju matematičkih problema, da će ih naučiti prevoditi jezik biti jednostavna stvar. Međutim, brzo je postalo očito da je problem mnogo teži i stvorena je disciplina računalne lingvistike.
U ranim danima računalne lingvistike, područjem su dominirali računalni znanstvenici. Od 1970-ih, međutim, postalo je očito koliko je jezik zapravo složen, a suvremena računalna lingvistika koristi stručnjake iz brojnih područja.
Strojno prevođenje oduvijek je bilo glavni cilj računalne lingvistike i ono u kojem je ovo područje napravilo ogromne korake. Zadatak je vrlo složen, zahtijeva prepoznavanje dijelova govora, razumijevanje gramatike, opsežan vokabular i mehanizme za rješavanje kolokvijalizama i slenga. Strojni prijevod daleko je od savršenog, ali svake godine prijevodi postaju točniji i manje prisiljeni.
Prepoznavanje govora još je jedno područje računalne lingvistike koje je izazvalo veliki javni interes. Nakon nekoliko neuspjelih pokušaja uvođenja mainstream softvera za prepoznavanje govora sredinom 1990-ih, polje je na neko vrijeme utihnulo. Međutim, početkom 21. stoljeća na tržište je stigao niz novih softverskih paketa za prepoznavanje govora koji se mogu pohvaliti opsežnim sustavima učenja i visokim stopama točnosti. To je dovelo do ponovnog interesa javnosti za softver za prepoznavanje govora i popratnog povećanja financiranja i istraživanja.
Generiranje govora je srodno područje računalne lingvistike koje se stalno razvija od 1980-ih. Postizanje prirodnog čitanja napisanog teksta vrlo je težak problem, ali ima ogromne potencijalne prednosti. Za korisnike koji ne vide, softver za generiranje govora može biti ključan za uživanje u plodovima digitalnog doba.
Računalna lingvistika također igra veliku ulogu u automatiziranim sustavima za ispravljanje gramatike, poput onih integriranih u većinu popularnih procesora teksta. Točna provjera gramatike zahtijeva sofisticiranu sposobnost identificiranja dijelova govora i sveobuhvatan popis gramatičkih pravila i iznimaka. Iako većina mainstream programa za provjeru gramatike još uvijek ima mnogo problema, oni već postaju nezamjenjivi za mnoge u novoj generaciji.
Računalna lingvistika je uzbudljivo područje koje se oslanja na širok raspon disciplina. Problemi koje mora riješiti je mnogo, a nijedan nije jednostavan. Međutim, futurističke vizije kojima se raduje čine ga vrijednom borbe. Od sna o univerzalnom prevoditelju do savršenog prepoznavanja govora, ciljevi računalne lingvistike ne mogu a da ne izazovu osjećaj čuđenja.