Što je zaustavna riječ?

U računalnim i mrežnim aplikacijama, zaustavna riječ je riječ koja se filtrira tijekom obrade neke vrste teksta, kao što je tijekom pokretanja pretraživanja na mreži. Poznata kao jedna komponenta obrade prirodnog jezika ili NLP-a, ideja iza ove vrste filtriranja je pomoći u ubrzavanju pretraživanja izostavljanjem uobičajenih članaka govora iz zahtjeva. Umjesto toga, tražilica koristi jednostavnu oznaku za bilježenje prisutnosti riječi u tekstualnom nizu, ali ne sprječava prisutnost te oznake da tu stranicu uključi u rezultate pretraživanja.

Jedan od načina da se shvati kako zaustavne riječi mogu zakomplicirati funkciju tražilica jest uzeti u obzir činjenicu da će prilikom provođenja pretraživanja motor uzeti u obzir svaku riječ koja je uključena u zahtjev za pretraživanje koji je podnio korisnik. Kao dio tog razmatranja, motor traži stranice koje sadrže svaku riječ. To znači da ako zahtjev za pretraživanje sadrži tri riječi, motor tri puta pregledava internet, dajući na kraju prioritet stranicama koje uključuju sve tri riječi.

Na primjer, pretraživanje kao što je “kuća na brdu” zahtijevalo bi od motora da pretraži svaku riječ u nizu, a neki čak dvaput pokreću pretraživanje zaustavne riječi “the”. To oduzima vrijeme i resurse koji bi se mogli preusmjeriti na pomoć u pretraživanju drugih ključnih riječi koje drugi krajnji korisnici trenutno provode. Korištenjem markera za zamjenu “the” i “on” tijekom pretraživanja, motor može posvetiti manje resursa i još uvijek vraća rezultate koji će vrlo vjerojatno zadovoljiti krajnjeg korisnika.

Iako se zaustavna riječ ponekad naziva otrovnom riječju, zapravo nema ništa posebno loše u uključivanju članaka govora u tekst koji se koristi za provođenje pretraživanja. Korištenje zaustavne riječi ili riječi kao dijela zahtjeva za pretraživanje može zakomplicirati proces indeksiranja tražilice pri pokušaju dohvaćanja podataka koji zadovoljavaju kriterije pretraživanja. Ipak, malo je vjerojatno da će krajnji korisnik vidjeti veliku razliku u ekstrakciji informacija koje se na kraju vraćaju.

Ne postoji tvrdi i brz popis riječi za zaustavljanje koji se univerzalno koristi u svim tražilicama. Zapravo, neke tražilice uopće ne koriste popis zaustavnih riječi kao dio zadatka obrade prirodnog jezika. Drugi će motori, međutim, naširoko koristiti popis zaustavnih riječi kao sredstvo za učinkovitije raspoređivanje resursa, dok će i dalje vraćati rezultate tražilice koji su točni i vjerojatno će biti vrlo prikladni za zahtjeve za pretraživanje koje je podnio svatko tko koristi određenu motor.