Strojno slušanje je obrada zvukova putem računala na način koji oponaša obradu ljudskih signala. Računala se mogu programirati i osposobiti da prepoznaju i interpretiraju niz audio ulaza. Ova se tehnologija može primijeniti na širok raspon načina, od analize inteligencije do proučavanja glazbe. Istraživači u ovom području rade u privatnim tvrtkama, akademskim institucijama i vladinim agencijama kako bi poboljšali alate za strojno slušanje i pronašli nove aplikacije. Integrira elemente akustike, elektrotehnike, robotike i obrade signala.
Kako bi prepoznala zvukove, računala ih moraju moći čuti i obraditi. Mogu koristiti prijemnike zvuka za rješavanje ambijentalne buke ili mogu slušati snimke. Zvukovi se mogu pokrenuti kroz algoritme kako bi se utvrdilo što su i što s njima učiniti. Računalni odgovori mogu ovisiti o njihovom programiranju, obučenosti i razini sofisticiranosti.
Jednostavan primjer strojnog slušanja može se vidjeti s klapama i softverom koji se aktivira glasom. Clappers omogućuju ljudima da uključuju i isključuju strujne krugove uz pljesak rukom koji aktivira baznu jedinicu. Softver koji reagira na glasovne naredbe može omogućiti ljudima da njime upravljaju svojim glasovima, što zahtijeva sposobnost prepoznavanja glasa i interpretacije zvukova. Takvi programi mogu koristiti obuku kako bi naučili prepoznati određenog govornika i rukovati naglascima, promjenama u sintaksi i drugim varijacijama među govornicima.
Složenije strojno slušanje može se koristiti u područjima poput glazbe, gdje istraživači identificiraju i proučavaju obrasce. Forenzički muzikolozi, na primjer, mogu usporediti i uspoređivati glazbu iz različitih izvora i mogu koristiti strojno slušanje u svom radu. Oni mogu utvrditi čini li se da glazba ima zajedničko podrijetlo ili ima druge karakteristike interesa. Ova se tehnologija također može koristiti za proučavanje harmonije i razvoj teorija o tome kako bi povijesna glazba mogla zvučati.
Analiza inteligencije također se oslanja na strojno slušanje. Ogromne količine audiopodataka u obliku telefonskih razgovora, rasprava na javnim mjestima i tako dalje možda će trebati obraditi obavještajne agencije. Plaćanje ljudima da slušaju sve audio zapise i razvijaju izvješća može biti skupo, a slušatelji kojima je dosadno mogu propustiti važne informacije. Strojno slušanje može omogućiti agenciji da automatski obrađuje zvuk kako bi izvukla podatke koji zahtijevaju veliku pozornost, na temelju ključnih riječi, tonova stresa u glasovima i drugih parametara. Obavještajni analitičari mogu dati prioritet svom radu na temelju ove automatske analize kako bi prvi slušali audiozapis koji će najvjerojatnije biti važan.