Što je audio rudarenje?

Audio rudarenje se obično koristi u softveru za prepoznavanje govora i analizi glazbe. Ova tehnologija daje korisniku mogućnost pretraživanja kroz govor ili glazbu audio koji je analiziran za određene karakteristike. Kada se koristi u tehnologiji prepoznavanja govora, audio rudarenje identificira izgovorene riječi u zvuku i stavlja ih u datoteku za pretraživanje. Ova značajka može biti korisna za studente ili one u poslovnom svijetu koji prisustvuju mnogim sastancima jer omogućuje korisniku lakše pregledavanje aktualnih informacija iz govornih prezentacija. Ova vrsta analize također se može koristiti u glazbi za određivanje karakteristika kao što su otkucaji u minuti (BPM), glazbeni tonalitet i glazbena struktura, informacije koje se koriste za klasifikaciju glazbe.

U prepoznavanju govora, gdje se tehnologija najčešće koristi, koristi se audio rudarenje za stvaranje akustičnog modela. Akustični model programira softver za prepoznavanje govora da prepozna govorne obrasce kao riječi. Ova tehnologija je razvijena audio rudarenjem snimke izgovorene fraze, koja se uspoređuje s tekstom koji odgovara izgovorenoj frazi. Računalo koristi informacije za prepoznavanje riječi kada korisnik proizvodi zvukove slične onima u akustičnom modelu. Akustični model se koristi u kombinaciji s datotekom koja govori programu za prepoznavanje govora koji jezik treba tumačiti i koji će se obrasci riječi vjerojatno izgovoriti u određenim rečenicama i situacijama.

Glazbenici i slušatelji glazbe mogu imati koristi od audio rudarenja u glazbi. Ponekad glazbeni softver koji kategorizira glazbu po žanru koristi audio rudarenje za organiziranje glazbe. Proces identificira i grupira glazbene datoteke sa zvučnim sličnostima koje se često javljaju u glazbenim žanrovima. Iako ova tehnologija može olakšati organiziranje glazbe i pronalaženje nove glazbe, može pogriješiti klasificirajući pjesme koje imaju slične mjerene karakteristike, ali različit ukupni zvuk. Softver za analizu zvuka može biti koristan glazbenicima, posebno skladateljima, jer omogućuje skladatelju da skoči na određene dijelove strukture pjesme, uključujući promjene glazbenih ključeva i riječi unutar teksta.

Proizvođač softvera za prepoznavanje govora Dragon® prodaje program pod nazivom AudioMining® koji transkribira audio datoteke i označava datoteke tako da se mogu pretraživati ​​za tekstom. Dragon je proizvođač računalnih lingvističkih programa, tehničkog izraza za područje softvera dizajniranog za tumačenje govora. Audio rudarenje, kada se koristi kao dvije riječi, opći je pojam koji se odnosi na analizu zvučne datoteke za određeni skup audio karakteristika. Ostali proizvođači softvera za rudarenje zvuka uključuju Nuance® i Nexidia®.