OpenAI tvrdi da je pronašao uzrok AI „halucinacija“ i nudi rešenje

OpenAI tvrdi da je identifikovao glavni uzrok „halucinacija“ u velikim jezičkim modelima, tendenciji AI sistema da izmišljaju odgovore koji nisu tačni. Ovaj problem već dugo muči industriju i podseća na ograničenja tehnologije, a istraživači sada sugerišu da greška leži u samom načinu treniranja i ocenjivanja modela.

Prema studiji objavljenoj prošle nedelje, jezički modeli su podstaknuti da pogađaju čak i kada nisu sigurni, jer im to tokom obuke povećava šanse za tačan odgovor. U klasičnom sistemu evaluacije AI dobija nagradu za tačan odgovor i kaznu za netačan, dok „ne znam“ ili iskazivanje nesigurnosti uvek biva ocenjeno negativno. To dovodi do prirodnog pritiska da modeli daju neki odgovor, makar i pogrešan, umesto da priznaju neizvesnost.

„Halucinacije opstaju zbog načina na koji se većina evaluacija boduje, modeli su optimizovani da budu dobri ‘učenici’, a pogađanje u uslovima nesigurnosti poboljšava rezultate testova,“ navode istraživači.

OpenAI smatra da rešenje leži u jednostavnom preokretu logike: kazniti samouverene netačne odgovore više nego izraze nesigurnosti, i dodeliti delimične poene za „ne znam“. Time bi se, kako tvrde, modeli usmerili da budu oprezniji i realniji u svojim tvrdnjama.

U praksi, to znači da bi evaluacije morale da prestanu da nagrađuju „srećna nagađanja“. Ako se ovakva promena sprovede, modeli bi mogli da razviju „bogatiju pragmatičku kompetenciju“ i time smanje učestalost halucinacija.

Ipak, ostaje da se vidi koliko će ovo imati efekta van laboratorije. Iako OpenAI tvrdi da njihov najnoviji GPT-5 halucinira manje, mnogi korisnici nisu primetili značajniji napredak. Problem je i dalje ključan za industriju koja ulaže desetine milijardi dolara i suočava se sa ogromnim ekološkim troškovima.

„Halucinacije ostaju fundamentalni izazov za sve velike jezičke modele, ali radimo naporno na njihovom daljem smanjenju,“ poručili su iz OpenAI-ja, prenosi Futurism.

AI Chatbot ChatGPT

Komentari (0)

Nema komentara 😞

Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!

Pridruži se diskusiji

Vrati se na početak

Drugi su čitali

Nauka i tehnologija
08.04.2026
2 min

Otkriven Satoši Nakamoto, Bitcoin tvorac? New York Times tvrdi da jeste…

Jedna od najvećih misterija moderne tehnologije navodno je rešena, jer The New York Times tvrdi da je otkriven Satoši Nakamoto, Bitcoin tvorac…

Uređaji
11.04.2026
3 min

Da li iPhone korisnici prelaze na Android?

Da bi se odbranio pred američkim sudom Apple traži odgovor na pitanje da li iPhone korisnici prelaze na Android – od Samsung kompanije!

Softver i servisi
11.04.2026
2 min

YouTube Premium ponovo poskupeo – cene povećane za oko 15%

YouTube Premium podiže cene pretplate za najmanje 15% u svim paketima, uključujući Studentski i YouTube Premium Lite već od narednog meseca

Uređaji
06.04.2026
2 min

Kako izgleda Honor 600 Pro u stvarnosti, prve realne fotografije

Honor 600 Pro u narandžastom izdanju ima upečatljivo lep dizajn, Snapdragon flegšip procesor i bateriju od čak 9000 mAh

Uređaji
09.04.2026
2 min

Zaboravite AI, Evropljani su proglasili Galaxy S26 Ultra za najbolji telefon zbog drugih inovacija

Galaxy S26 Ultra proglašen je najboljim telefonom u Evropi, ali ne zbog AI funkcija već zbog kamere, baterije i kvaliteta izrade

Testovi

Telefoni
03.04.2026
11 min

Honor 600 Lite recenzija - cena nepromenjena

Cene telefona rastu iz dana u dan a Honor 600 Lite je jedan od svetlih primera na tom planu - uz značajna unapređenja u odnosu na svog prethodnika

Pametni satovi
06.04.2026
10 min

Ne samo za trčanje - Huawei Watch GT Runner 2 recenzija

Huawei Watch GT Runner 2 je pametni sat namenjen trčanju, ali sa mogućnostima koje ga preporučuju svima. Kako radi, pročitajte u našoj recenziji.

OpenAI tvrdi da je pronašao uzrok AI „halucinacija“ i nudi rešenje

Nema komentara 😞

Microsoft uklanja Copilot dugmad iz Windows 11 aplikacija

Tri nove Google Maps funkcije menjaju način korišćenja aplikacije

Reagovao Apple: Viralne Artemis II fotografije označene „Shot on iPhone“

BMW iX5: Nove Michelin gume i više od 650 konjskih snaga

Kako izgleda kapsula misije Artemis II iznutra i zašto je tako osmišljena

YouTube Premium ponovo poskupeo – cene povećane za oko 15%

MacBook Neo ubrzao poboljšanja Windows 11 operativnog sistema

Huawei Pura 90 serija stiže 20. aprila, objavljene slike

Da li iPhone korisnici prelaze na Android?

Prvi čovek BYD razvojnog odeljenja: Baterije sa čvrstim elektrolitom za EV ulaze u kritičnu fazu, ali nisu jedina opcija

Gemini dugme u Chrome-u možda deluje nebitno na prvi pogled, ali može da vam uštedi dosta vremena tokom svakodnevnog rada

Honor WIN 2 sprema ozbiljan iskorak: u fokusu su veći ekran i Snapdragon 8 Elite Gen 6

Ostani u toku

Nema komentara 😞