Što je kanonilizacija?

Riječ kanonski znači nešto što je u skladu s prihvaćenim standardom. Kanonilizacija – ili kanonizacija na britanskom engleskom – je proces kojim se nešto dovodi u suglasnost s prihvaćenim standardom. U području računala, pojam kanonilizacija se koristi za označavanje ispunjavanja standarda u nekoliko različitih područja. Često se smatra da je problem, a zapravo je rješenje za razne probleme. Budući da je riječ o tako dugačkoj riječi, kanonilizacija je skraćena korištenjem njenog prvog i posljednjeg slova i broja slova između: c14n.

Canonicalization se koristi u IT (Informacijska tehnologija) u nekoliko postavki. Odnosi se na adrese pošiljatelja e-pošte, na konstrukciju naziva datoteke, na kodiranje nizova u Unicodeu, na korištenje XML-a (EXtensible Markup Language) i na konstrukciju URL-a (Uniform Resource Locator). U svakom slučaju, problem je kapacitet za više formata koji predstavljaju istu stavku, pri čemu je kanokalizacija put do dosljednosti i standardizacije.

Uzmimo XML kao primjer. XML dopušta sintaktičke promjene. To znači da dva dokumenta koja nisu identična mogu imati isti kanonski oblik, a time i biti funkcionalno ekvivalentna. Canonical XML specifikacija osmišljena je kako bi to riješila uspostavljanjem metode kojom se može utvrditi identitet zasebnih dokumenata. Metoda za generiranje kanonskog oblika za bilo koji XML dokument naziva se metoda XML kanokalizacije.

Za kanokalizaciju URL-a, ideja je da se na određenu web stranicu dosljedno poziva jedan URL. Najjednostavniji primjer su dvije verzije početne stranice, od kojih jedna ima tri w, a druga ne:

http://www.wisegeek.com

protiv
http://wisegeek.com
To je problem za SEO (Search Engine Optimization) jer dijeli izvješća o prometu, a svi oni zapravo idu na isto mjesto. Rezultat je da web-mjesto s više URL-ova za iste stranice izgleda lošije nego što zapravo jest.
Postoje i drugi problemi osim w. To uključuje završne kose crte i razlike između verzija URL-a s velikim i malim slovima. Matt Cutts iz Googlea® preporučuje da se to riješi korištenjem trajnog (301) preusmjeravanja svih alternativnih URL-ova na URL koji želite, što omogućuje tražilicama da prosude koji je kanonski URL.