Što je podudaranje sheme?

Usklađivanje sheme je tehnika koja se koristi za spajanje dvije ili više složenih baza podataka ili skupova informacija jedna u drugu. Kako upotreba baza podataka i elektroničkih pohranjivanja informacija postaje sve veća i složenija kroz Internet, moraju se definirati metode za spajanje skupova podataka iz jedne baze podataka u drugu, a usklađivanje shema je jedna od takvih tehnika. Koncept je jednostavan, ali stvarnost spajanja podataka prilično je složena.

Izraz “podudaranje sheme” koristi se kao sinonim za “mapiranje sheme”, jer korisnici zapravo mapiraju podatke, a ne podudaraju ih. Dvije ili više baza podataka se mapiraju zajedno, a slični aspekti svake baze podataka se mapiraju jedan u drugi. Najčešći način spajanja podataka je korištenje točnih referenci. Primjer ovog stila spajanja je kombiniranje stupca naziva jedne baze podataka sa stupcem naziva druge baze podataka.

Spajanje obično nije tako jednostavno, za ljude ili računala. S toliko podataka koje je potrebno filtrirati, kombinirati i koristiti, neophodno je imati jednu bazu podataka umjesto više baza podataka. Mapiranje sheme usredotočuje se na to da ovaj zamoran proces bude automatiziran i učinkovitiji. Primjer gdje je potrebno podudaranje sheme može biti kada jedna baza podataka ima polje “studentski smjer”, a druga baza podataka polje “studentovo polje studija”. To je ista informacija, ali malo drugačiji naslovi kompliciraju napore da se to spoji.

Usklađivanje sheme razbija ovaj složeni proces spajanja baza podataka u četiri koraka: predintegraciju, usporedbu, usklađivanje i spajanje. Prije nego što se više baza podataka može spojiti, potrebno ih je analizirati na sličnosti i razlike. U području usklađivanja sheme, to je poznato kao predintegracija. Računalo počinje određivati ​​najučinkovitiju metodu integracije.

Zatim računalo procjenjuje sheme uspoređujući ih međusobno na detaljnijoj razini. U koraku usporedbe, računalo gleda svaki unos baze podataka i utvrđuje gdje bi moglo doći do sukoba. Primjer za to je kada polje “interes učenika” navodi “liječnik”, a druga baza podataka ga navodi kao “liječnik”. Osoba bi vjerojatno prepoznala te informacije kao iste, ali za alate baze podataka to su dva odvojena entiteta.

Nakon što računalo utvrdi sve potencijalne sukobe, može krenuti naprijed s pokušajem rješavanja problema. To može biti jednostavno kao mijenjanje svih instanci “liječnik” u “liječnik”. U stvarnosti, proces je znatno složeniji.
Nakon što su svi sukobi popravljeni, računalo može nastaviti sa spajanjem podataka u procesu usklađivanja sheme. U ovoj fazi, dvije ili više baza podataka se spajaju u jednu veliku bazu podataka. Ako sve prođe dobro, neće doći do sukoba ili pogrešaka tijekom integracije i budućeg pristupa bazi podataka.