Što je prepoznavanje imenovanih entiteta?

Iako je iz perspektive krajnjeg korisnika proces unosa podataka u računalo prilično jednostavan, proces zapravo pokreće nekoliko drugih manjih procesa. Za svaki podatak, računalo mora prevesti tu informaciju na jezik koji razumije. Računala koriste interni jezik poznat kao binarni u kojem se skup znakova “1” i “0” formira zajedno kako bi računalu rekli što treba učiniti. Prepoznavanje imenovanih entiteta metoda je pojednostavljenja procesa prevođenja od ulaza do podataka, pomažući računalu u razbijanju rečenica na njihove sastavne dijelove.

Kada unosite podatke pomoću većine računalnih programa ili web-stranica, program ili web-stranica općenito traži od vas da unesete određenu informaciju u svako polje, kao što su polja “Naziv” ili “Adresa”. Program za prepoznavanje imenovanih entiteta uklanja većinu toga, dopuštajući krajnjem korisniku da umjesto toga unese nizove – rečenice – teksta, pružajući prirodnije sučelje. Program uzima podatke koje ste unijeli i razvrstava ih u dijelove koje može lakše razumjeti.

Uzmite rečenicu kao što je “Joe je naručio četiri bušela banana.” U tradicionalnom programu, krajnji korisnik bi morao unijeti “Joe” u polje “Ime zaposlenika”, “Banane” u polje “Vrsta kupovine”, “četiri” u polje “Količina” i “bushels” u polje “Jedinice”. U postavci za prepoznavanje imenovanog entiteta, krajnji korisnik bi jednostavno unio cijelu rečenicu kako je napisana. Čim korisnik klikne na Pošalji, računalo razvrstava rečenicu u dijelove, obavljajući istu raščlambu podataka koju bi korisnik ranije koristio.

Iako je ovo daleko jednostavnije od tradicionalnog ulaznog programa dizajniranog iz polja, postoji jedan značajan nedostatak: potencijalni neuspjeh algoritma prijevoda. Manje inteligentni algoritmi za prepoznavanje imenovanih entiteta mogli bi samo “razumjeti” rečenicu na jedan specifičan način. Drugim riječima, ako je zaposlenik preformulirao rečenicu i napisao “Joe je naručio četiri bušela banana”, program bi mogao imati poteškoća s razumijevanjem i razvrstavanjem dijelova. Iz tog razloga, iako krajnji korisnik više nije odgovoran za unos podataka u polja, to još uvijek nije tako slobodnog oblika kao što se sustav na prvu čini.