Što je semantička integracija?

“Semantička integracija” je pojam koji se koristi u nekoliko konteksta u različitim područjima računalnog dizajna, programiranja, upravljanja i administracije. Općenito, to se odnosi na prikupljanje informacija iz jednog ili više različitih izvora u svrhu stvaranja nekog sustava u kojem su informacije organizirane na način koji korisniku ima smisla. Semantička integracija često se bavi definiranjem i uspostavljanjem veza metapodataka, ili odnosa, između različitih dijelova različitih izvora podataka kako bi se mogli logički strukturirati. To bi moglo uključivati ​​stvaranje relacijskih veza između dviju zasebnih baza podataka, izgradnju grafa kako su dijelovi različitih web-mjesta međusobno povezani, ili integraciju činjeničnih podataka iz nepoznatog, proizvoljnog formata u sažetu strukturu zapisa. Postoje mnoge praktične primjene za potpuno implementiran sustav semantičke integracije, uključujući istraživačke biblioteke ili mreže, više organskih algoritama tražilice koji mogu ekstrapolirati kontekst iz pretraživanja i, u konačnici – korištenjem objavljivanja metapodataka – besprijekornu integraciju različitih računalnih sustava za razmjenu podataka .

Konačni cilj semantičke integracije u većini slučajeva je sposobnost povezivanja informacija na dinamičan način. U vrlo jednostavnom primjeru, to bi moglo značiti mogućnost povezivanja polja u jednoj bazi podataka s poljima u drugoj bazi podataka, unatoč činjenici da se ne podudaraju točno, kao što je povezivanje polja pod nazivom “veličina” s poljem pod nazivom “visina”. Ovo povezivanje se može izvesti putem korisnički definiranih pravila koja specifično povezuju ta dva, ili se može izvesti s algoritmima koji uspoređuju numeričke podatke polja i određuju vjerojatno podudaranje. Riječi “veličina” i “visina” tada postaju termini metapodataka koje bi drugi vanjski sustavi semantičke integracije mogli upotrijebiti za pronalaženje informacija za korisnika bez da moraju znati kako bilo koji pojedinačni sustav pohranjuje podatke.

U složenim sustavima semantičke integracije, poput onih dizajniranih za istraživanje, objavljivanje i dijeljenje metapodataka ključna je komponenta za rad. Metapodaci se mogu izdvojiti iz dokumenata kako bi se oblikovale velike relacijske strukture podataka koje mogu pomoći u upitima. To znači da se istraživački radovi o bilo kojoj temi mogu integrirati u sustav koji mjeri i bilježi učestalost riječi, a te riječi mogu pomoći u pretraživanju informacija korisnika, dopuštajući da se srodne teme navedu iz bilo kojeg izvora bez potrebe za posebnim pretvorbama.

Jedan od izazova s ​​kojima se susreću dizajneri sustava semantičke integracije jest kako agregirati podatke. Korištenje ljudi za klasifikaciju i uspostavljanje odnosa između podataka iz različitih izvora može biti dugotrajno i, u konačnici, vrlo se oslanjati na individualna iskustva osobe. Kada se algoritmi koriste za automatsko uspostavljanje asocijacija, određeni odnosi mogu biti zanemareni zbog neke manje razlike koju algoritam ne može riješiti. Metoda implementacije semantičke integracije u velikim razmjerima koristi algoritme temeljene na učenju u sprezi s ljudskim upravljanjem pravilima i, u nekim slučajevima, stvarnim ljudskim donošenjem odluka tijekom procesa.