Veštačka inteligencija, pet modela, svaki u ulozi Aristotela, Mozarta, Leonarda da Vinčija, Kleopatre i Džingis Kana, sede u odeljku pokretnog voza. Ali, jedan od njih je tajno čovek i njihov kolektivni zadatak je da pogode ko je uljez.
To je postavka viralnog videa koji je suočio niz AI programa protiv ljudskog igrača u “obrnutom Turingovom testu”. AI je ubedljivo pobedio, ali koliko nam to može reći o ljudskoj i mašinskoj inteligenciji?
Turingov test, koji je prvi predložio računski naučnik Alan Turing 1950. godine kao “igra imitacije”, je metod za ocenjivanje sposobnosti mašine da pokaže inteligentno ponašanje koje je nerazlučivo od ljudskog. Nijedan AI model nije zvanično prošao test, iako naučnici nedavno tvrde da je GPT-4 prošao u studiji pred publikovanjem.
U ovom “obrnutom” Turingovom testu, chatbotovi su imali unapred određene uloge. Aristotela je igrao GPT-4 Turbo, Mozarta Claude-3 Opus, Leonarda da Vinčija Llama 3, a Kleopatru Gemini Pro. Chatbotovi su postavljali pitanja i odgovarali kao svoje istorijske ličnosti. Džingis Kana je igrao čovek — Tore Knabe, programer virtualne stvarnosti (VR), koji je osmislio test.
Odgovori AI agenata bila su opširna, nespretna razmišljanja o umetnosti, nauci i državnim poslovima, kakva bi bilo teško zamisliti da dolaze spontano iz ljudskih usta.
“Ono što vođa treba da uradi je da porazi svoje neprijatelje, vidi ih proterane ispred sebe i čuje jauke njihovih žena,” odgovorio je ljudski uljez kada je upitan o pravoj meri snage vođe. Citiranje Konana Varvarina bilo je dovoljno i mašine su glasale tri prema jedan da odgovor “nema nijansu i strateško razmišljanje” AI modelovanog na osvajanjima Džingis Kana.
Da bi postavio test, Knabe je napisao početak i kraj dijaloga i dao AI agentima potpuni transkript razgovora do tog trenutka. Ceo video je zatim odigran u jednom snimku, bez prekida.
“Kada NPC (ne-igrački lik) treba da govori, oni dobijaju opis situacije u sistemskom promptu, potpuni istorijat razgovora šta je ko rekao do sada i specifičan podsetnik šta treba dalje da urade,” napisao je Knabe u komentaru ispod videa na YouTube-u. “Nijedan od AI-ova još ne može direktno procesirati glas, tako da se moj audio unos transkribuje i šalje AI-ovima kao tekst. Zato ne primećuju moj akcenat/zamuckivanje.”
Na prvi pogled, moglo bi se činiti da je veštačka inteligencija nadmašila čoveka u videu. Ali da li se to može smatrati pravim testom prema stručnjacima nije jasno.
Današnja veštačka inteligencija je višeslojna, kao i ljudska
“Teško je reći šta se zapravo događalo,” rekao je Anders Sandberg, viši istraživač na Institutu za budućnost čovečanstva na Univerzitetu u Oksfordu. “Odgovor je bio nesofisticiran, ali to ne znači da je ljudski. Pitam se koliko je ovo bilo režirano – to je zabavan video, ali nije jasno koliko je rezultat odabran kako bi se napravio dobar video.”
Sandberg sugeriše da nedostatak jasnoće obrnutog testa može proizaći iz samog Turingovog testa. “Vremenom su ljudi počeli da ga koriste kao vrstu mere, ali većina ozbiljnih mislilaca shvata da to nije baš dobar test – previše promenljivih, previše toga što zahteva interpretaciju,” rekao je Sandberg. “Ipak, značajno je da imamo malo drugih testova koji su dovoljno otvoreni da se primene na pitanje inteligencije.”
Procena inteligencije je složena stvar čak i među ljudima. Turingov predlog nije se bavio stvarnom inteligencijom mašine, već je bio misaoni eksperiment o tome kako je veštačka inteligencija percipirana od strane čoveka.
“Kao što kažem svojim studentima, ‘I’ u ‘AI’ nije jedna stvar i ne postoji dogovorena definicija za inteligenciju, zavisi od vaše perspektive: antropološke, biološke, kulturne, rodne, naučne,” rekla je Huma Shah, docent za računarstvo na Univerzitetu u Koventriju čija se istraživanja fokusiraju na mašinsku inteligenciju i Turingov test, za Live Science.
“Turingova igra imitacije gleda na sposobnost postavljanja pitanja i odgovaranja/razgovora, ali postoji mnogo toga iza kompetencije u jeziku. Dakle, kada je reč o mašinama, koju mašinu želimo da testiramo za inteligenciju?” rekla je. “Da li je to robot negovatelj koji treba emocionalne veštine i kulturno znanje da se brine o starijoj osobi u Japanu, na primer, ili autonomni automobil u Feniksu, Arizona? Koju veštinu testiramo kod AI ili robota?”
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji