Prijateljska AI pojam je koji istraživači umjetne inteligencije (AI) koriste za označavanje AI sustava koji općenito izvode radnje koje su korisne za čovječanstvo, a ne neutralne ili štetne. To ne znači slijepu poslušnost – naprotiv, izraz se koristi za opisivanje AI sustava koji su prijateljski nastrojeni zato što to žele, a ne zbog bilo kakve vanjske sile. Osim što se odnosi na dovršene sustave, Friendly AI je i naziv teorijske i inženjerske discipline koja bi se koristila za uspješno kreiranje takvih sustava.
Izraz “Friendly AI” potječe od Eliezera Yudkowskyja iz Instituta za umjetnu inteligenciju Singularity, čiji je cilj stvaranje Friendly AI dovoljno pametne da poboljša vlastiti izvorni kod bez intervencije programera. Njegov rad na tu temu, Creating Friendly AI, objavljen na internetu 2001. godine, vjerojatno je prva rigorozna obrada te teme. Yudkowsky se poziva na argumente iz evolucijske psihologije i drugih kognitivnih znanosti kako bi podržao svoj pristup problemu prijateljske AI.
Prijateljska umjetna inteligencija smatra se važnom kao akademska disciplina jer su prošli pokušaji da se “odgovori” na problem lažne umjetne inteligencije općenito pozivali na stroga programska ograničenja, koja će se sigurno urušiti pod alternativnim tumačenjima, kada AI postane pametniji od ljudi, ili jednostavno kada dobije sposobnost reprogramiranja sebe. Antropomorfizam je također problem u AI. Budući da evolucija izgrađuje organizme koji su skloni biti sebični, mnogi mislioci pretpostavljaju da bi bilo koja umjetna inteligencija koju izgradimo imala istu tendenciju, odmah ili nakon što postane dovoljno pametna.
Evolucija izgrađuje organizme s egocentričnim sustavima ciljeva jer ne postoji drugi način. Altruističkim sustavima ciljeva trebalo je mnogo milijuna godina da se razviju, i to samo u uvjetima u kojima su pripadnici istog plemena imali mnogo dobiti pomažući jedni drugima i mnogo izgubiti zanemarivanjem. Ali ako bismo dizajnirali um od nule, mogli bismo ga izgraditi bez egocentričnog sustava ciljeva. To ne bi bilo “ograničavanje AI” – to bi jednostavno bilo stvaranje AI koji je po prirodi nesebičan.
Gore navedeno zapažanje je jedno od mnogih koje doprinose polju Friendly AI, koje je iznimno novo i još uvijek treba puno raditi. Neki istraživači umjetne inteligencije tvrde da ne možemo odrediti značajke dizajna potrebne za implementaciju Friendly AI dok nemamo pametnije AI sustave za eksperimentiranje. Drugi tvrde da je čisto teorijski pristup ne samo moguć, već i etički neophodan prije početka ozbiljnog pokušaja opće umjetne inteligencije.