Audio transkripcija je proces uzimanja izgovorenih riječi i pretvaranja u pisani tekst. U prošlosti je osoba sjedila i pisala riječi dok su bile izgovorene. Sada postoje audio snimci raznih vrsta i nekoliko metoda transkripcije. Analogne i digitalne metode snimanja će omogućiti osobi koja nije prisutna tijekom razgovora da ipak prepiše tekst. Osim toga, mnogi softverski paketi čitat će audio datoteke i brzo ih pretvoriti u tekst bez potrebe za stvarnom reprodukcijom.
Dugi niz godina audiotranskripcija je bila specijalizirana i zamorna profesija. Ljudi koji su transkribirali govor morali su biti prisutni u vrijeme govora, što često znači da bi tvrtke morale zaposliti ljude obučene u naprednim tehnikama kao što je stenografija. To je također ograničilo usluge prepisivanja na one koji su imali pristup obučenom prepisivaču.
Izumom audio zapisa ovo se područje dramatično promijenilo. Sa snimkom, prepisivač bi mogao raditi s bilo kojeg mjesta gdje bi se snimka mogla dostaviti. Osim toga, transkripcija više nije trebala stenografiju jer se snimka mogla preokrenuti i preslušati više puta. Jedna prepisivačica također je mogla raditi za mnoštvo klijenata istovremeno, budući da više nije trebala biti prisutna na govorima.
S povećanjem korištenja računala i brzine interneta, područje audio transkripcije ostalo je uglavnom isto. Datoteke, a ne trake, često su se slale e-poštom umjesto uobičajenom poštom. Brzina procesa se povećala, ali metode nisu.
To se promijenilo kasnih 90-ih sa sve većom upotrebom softvera za prepoznavanje govora i diktiranja. Posao prepisivanja sve je više išao prema računalnoj pomoći, a potom i potpunoj automatizaciji. Izašli su softverski paketi koji su mogli čitati informacije unutar audiodatoteke i koristiti valne uzorke zvučnika za izradu tekstualne verzije govora. Ovo bi trajalo sekunde, a ne minute ili sate ljudskog prepisivača.
Računalno automatizirana audio transkripcija ima nekoliko nedostataka koje je teško prevladati, od kojih je najveći relativni nedostatak korektivnog govora. Kada ljudski prepisivač sluša tekst, može ispraviti male greške u govoru kako bi ga učinio čitljivijim. Dok je neka transkripcija doslovno, što znači da je točno ono što je osoba rekla, većina nije. Bez korektivnog govora, čovjek će često morati provjeravati pogreške u transkripciji prije nego što se upotrijebi.
Druga uobičajena mana računalne audio transkripcije leži u samom govoru ljudi. Budući da ljudi imaju ogroman raspon tonova i obrazaca kada govore, stvaranje računalnog programa koji može točno pročitati i prevesti cijeli raspon je iznimno teško. To znači da je određena količina pogreške uobičajena u gotovo svim softverima za transkripciju. Najčešći način rješavanja ovog nedostatka je putem naučenog govora, gdje program i jedan govornik rade zajedno dovoljno da se program usredotoči na obrasce jedne osobe.