Što je korpusna lingvistika?

Korpusna lingvistika proučava jezik koristeći primjere iz stvarnog života. To nije grana lingvistike već metodologija ili pristup. Corpus, latinska riječ za “tijelo”, odnosi se na tijelo prirodnih tekstova, a pristup uključuje otkrivanje obrazaca upotrebe jezika kroz analizu korpusa. Korpusna lingvistika doživljava povratak, budući da su računalni programi revolucionirali pristup.

Roditeljski dnevnici djetetova govora dok ono prvo usvaja jezik jednostavan su primjer korpusa koji se zatim može proučavati kako bi naučio jezične obrasce. Nastava stranih jezika u prvoj polovici 20. stoljeća često je koristila korpuse ciljanog jezika za sastavljanje popisa rječnika za učenike. Ugledni lingvist Noam Chomsky nije smatrao korištenje korpusa valjanim alatom, jer je vjerovao da je jezična kompetencija važnija od podataka o izvedbi. Rana korpusna lingvistika uglavnom se temeljila na pretpostavci da postoji ograničen broj rečenica u prirodnom jeziku i da se te rečenice mogu prikupljati i vrednovati.

Nakon što je 60-ih i 70-ih godina prošlog stoljeća zapala u nemilost, korpusna lingvistika doživljava preporod zbog metodološke uporabe računala. Program konkordancije naziv je softvera koji jezikoslovci najčešće koriste. Dok bi pretraživanje uzoraka u korpusu od milijuna riječi ljudskom biću oduzelo previše vremena i rezultati bi bili manje nego točni, računalo može pretraživati ​​i dohvaćati informacije u samo nekoliko sekundi. Može izračunati učestalost, sortirati podatke i iskorištavati korpuse na načine koji su bili nemogući u prošlosti.

Analiza temeljena na korpusu može ispitati kako registar utječe na jezik; obrasci korištenja jezika, kao što je način na koji muškarci i žene različito koriste pitanja s oznakama; u kojoj se mjeri koriste jezični obrasci; te čimbenici koji utječu na varijabilnost upotrebe jezika. Nastava može imati koristi od korpusne lingvistike u oblikovanju nastavnog plana i programa, razvoju korištenih materijala i vrsti aktivnosti koje se koriste u učionici. Učenici bi mogli imati koristi od pristupa tako što bi mogli jasnije odrediti različite upotrebe i značenja uobičajenih riječi, razlike svojstvene pisanom i govornom jeziku, te fraze i kolokacije koje bi mogli koristiti. Tijelo podataka koji je korpus stalno se ažurira i proizvod je društvenih interakcija u stvarnom životu. Dakle, korpusi su naturalistički podaci kojima je lako pristupiti, a nalazi se mogu generalizirati.