Ekstrakcija znanja je proces korištenja različitih izvora informacija za stvaranje kohezivne banke znanja. Kao dio ovog pristupa, ekstrakcija će se često oslanjati na niz strukturiranih i nestrukturiranih izvora. Kada je uspješno, ekstrakcija znanja rezultira čvrstim podacima koji se lako mogu čitati i interpretirati određenim programom, dopuštajući krajnjem korisniku da koristi to formalno znanje u bilo koju svrhu koju želi.
U procesu ekstrakcije znanja može se koristiti nekoliko različitih izvora. Unutar opsega strukturiranih izvora, podaci se mogu izdvojiti iz različitih tipova relacijskih baza podataka ili neke vrste proširivog označnog jezika ili XML izvora. Nestrukturirani izvori, kao što su slike, različiti oblici dokumenata za obradu teksta, proračunske tablice, pa čak i tekst snimljen programima u stilu bilježnice mogu se koristiti kao dio procesa ekstrakcije. Sve dok su izvori čitljivi za program koji se koristi za upravljanje procesom ekstrakcije znanja, oni se mogu koristiti kao izvori koji proširuju potencijal projekta koji se napreduje pomoću ekstrakcije i omogućuju da konačno proizvedeno znanje bude upotrebljivo. .
Postoji nekoliko uobičajenih aplikacija koje se javljaju kod izvlačenja znanja. Jedan čest primjer je sposobnost hvatanja podataka iz nestrukturiranog izvora i ugradnje u neku vrstu strukturiranog izvora znanja. Ekstrahiranje podataka pronađenih u relacijskim bazama podataka i njihovo korištenje za stvaranje novih dokumenata ili korištenje elektroničkih dokumenata za uvoz podataka u relacijske baze podataka, još je jedan primjer kako ova vrsta ekstrakcije može ubrzati dijeljenje formalnog znanja bez potrebe za ručnim unosom podataka koji je već dostupan iz nekog drugog izvora. Ova ponovna upotreba postojećeg znanja u nekom novom formatu često je vrlo korisna u brojnim scenarijima, što omogućuje korištenje tog znanja na načine koji možda nisu bili mogući s postojećim izvorom. Na taj način, korisnik može stvoriti izvore koji su idealni za niz različitih aplikacija, a ne samo za one relevantne za izvorni dom formalnog znanja.
Korištenjem ekstrakcije podataka moguće je koristiti ogromno skladište podataka, jednostavno uvoziti i izvoziti podatke kao način stvaranja nekog novog izvora koji je upotrebljiv za određenu svrhu. Ovi novostvoreni izvori zauzvrat također nalaze mjesto u skladištu podataka i na kraju se mogu koristiti u stvaranju novih ekstrakcija koje se koriste za zadovoljavanje novijih potreba korištenja. Imajući to na umu, vađenje znanja može se promatrati kao vrlo koristan alat koji pomaže u maksimalnom iskorištavanju svih resursa koji su trenutno pri ruci, pojednostavljujući mnoge zadatke uključene u dijeljenje tog formalnog znanja.