Što su statistički nevjerojatne fraze?

Statistički nevjerojatne fraze, ili SIP, tehnologija je pretraživanja koju je razvio Amazon.com za pretraživanje sadržaja knjiga za fraze sadržane u njima koje su vjerojatno jedinstvene ili se često pojavljuju. Ovo je dio Amazonovog patentiranog tehnološkog programa Search Inside!®. U suštini, Search Inside® Amazonu daje pristup djelomičnom ili cijelom tekstu knjige, tako da se određene fraze mogu koristiti za identifikaciju te knjige ako se u pretraživanju koriste statistički nevjerojatne fraze.

Naziv za ovu tehnologiju je pomalo zbunjujući. Kada obavljate pretragu, želite da se ono što tražite blisko podudara. Identificiranjem jedinstvene fraze u knjizi, ako koristite tu frazu za pretraživanje, malo je vjerojatno da će vaše pretraživanje navesti nešto što ne želite. Ako tražite određenu knjigu i ne možete se sjetiti naslova, ali se možete sjetiti citata iz nje, možete upotrijebiti citat za traženje knjige.

Alternativno, možda ćete htjeti tražiti određenu temu, unutar većeg predmeta. Na primjer, ako ste željeli potražiti knjigu sa savjetima o karijeri, ali ono o čemu ste stvarno željeli pročitati je kako se umrežiti za poslove, mogli biste tražiti “umrežavanje” umjesto “savjet za karijeru”. Odmah se neke od najrelevantnijih pretraživanja pojavljuju na stranici rezultata pretraživanja Amazona, uključujući knjige poput Dig Your Well Before You’re Thirsty: Jedina knjiga o umrežavanju koja će vam ikada trebati.

Ako ste tražili s ovim vrstama statistički nevjerojatnih fraza, možete primijetiti da možete dobiti rezultate koji se baš i ne podudaraju. Na primjer, prvi rezultat pretraživanja za umrežavanje nije za umrežavanje u karijeri, već za računalne i tehnološke mrežne informacije. Možete napraviti bolje statistički nevjerojatne fraze ako budete precizniji. Na primjer, dobivate bolje rezultate pretražujući pod Karijera umrežavanje ili posao umrežavanje.

Statistički nevjerojatne fraze su zapravo vjerojatne fraze, budući da je vjerojatno izraz jedinstven za knjigu Search Inside!® na čelu popisa stvari koje tražite. Mogli biste, na primjer, unijeti Shakespeareov redak iz Shakespeareovog soneta kako biste prikazali knjige o Shakespeareu. Ovo ne funkcionira uvijek dobro jer se neki vrlo dobro poznati citati koriste u mnogim drugim knjigama kao naslovi. Hamleta nećete pronaći ako tražite “Biti ili ne biti”. Niti ćete pronaći Macbetha sa statistički nevjerojatnim frazama poput “Van! Prokleto mjesto.” Zapravo, pod ovim posljednjim pojmom, prva knjiga koju ćete pronaći je ona o uklanjanju mrlja.

Korištenje statistički nevjerojatnih fraza također je način pretraživanja web sadržaja, a web indekseri mogu koristiti sličnu tehnologiju kako bi ljudi mogli najučinkovitije i posebno pretraživati ​​određene jedinstvene linije. To nije savršena tehnologija budući da alat za indeksiranje ne mora nužno procijeniti sadržaj. Može tražiti ponavljanje ključnih riječi koje ljudima omogućuje pronalaženje dijelova s ​​većim brojem ponavljanja ključne riječi. Nemaju sve knjige na Amazonu Search Inside!® tehnologiju, ali čini se da je to trend. U konačnici, čak i ako je sustav malo nesavršen, mogao bi skratiti vrijeme pretraživanja.