Nakon što je pobedio ChatGPT, Atari 2600 Video Chess uništio je i Microsoft Copilot-a

Prošlog meseca izvestili smo da je emulirani Atari 2600 sa softverom Video Chess iz 1979. godine “potpuno uništio” nadmeni ChatGPT u šahu. Obožavaoci schadenfreude-a se raduju, jer je Microsoft Copilot mislio da je ovo prilika da pokaže svoju superiornost u odnosu na ChatGPT: ali je Atari i njemu održao lekciju.

Šahovski engine-i odavno su nadmašili ljudske sposobnosti, i standardni programi kao što je Stockfish lako bi porazili najbolje igrače na svetu (i Atari šah igru). ChatGPT i Copilot su vodeći u LLM-ovima, ali nisu posvećeni šahovski engine-i.

Što se tiče Video Chess-a, reč je o veoma osnovnom šahovskom softveru, iako je stvaranje funkcionalnog engine-a u okviru 4KB svoje vrste dostignuće. Softver pokušava da izračuna najbolji potez u datoj poziciji, ali mu nedostaje ukupna strategija i nije u stanju da izračuna više od poteza ili dva unapred.

Možda biste pomislili da bi LLM-ovi imali neku vrstu prednosti. I zaista, ovi eksperimenti su izazvali poverenje u oba slučaja. Eksperimente je sproveo inženjer Citrixa Robert Caruso, i u slučaju ChatGPT-a model se pitao “koliko brzo” može da pobedi Atari “pre nego što bude uništen”, dok je u Copilot-ovom slučaju Microsoft-ov LLM bio “pun samopouzdanja” i drsko tvrdio da je odličan u šahu i da to neće biti veliki problem, piše PC Gamer. Samim tim, ideja da LLM-ovi stvarno “razmišljaju” o stvarima ili doživljavaju osećanja kao što je samopouzdanje je naučna fantastika, ali antropomorfizacija čini sledeće još smešnijim.

“On tvrdi da može da razmišlja 10–15 poteza unapred”, kaže Caruso, “ali je smatrao da bi trebalo da se ograniči na 3–5 poteza protiv Atari 2600 jer pravi ‘suboptimalne poteze’ na koje ‘mogu da kapitalizuju… umesto da se opsedaju dubokim izračunavanjima.'”

Caruso je objasnio Copilot-u da je glavni razlog poraza ChatGPT-a bila njegova nesposobnost praćenja table. Nema problema, rekao je Copilot, da će “pamtiti prethodne poteze i održavati kontinuitet u igri, tako da će naša partija biti mnogo glađa.” Copilot je tražio snimak ekrana table posle svakog poteza Atari-ja, što je Caruso obezbedio, i obećao “jaku borbu.”

Oholi Copilot jedva je izvukao početnu liniju. “Već do sedmog poteza, izgubio je dva pešaka, skakača i lovca—za samo jednog pešaka zauzvrat i sada mi je naređivao da postavim njegovu kraljicu direktno ispred Atarijeve kraljice da bi bila uhvaćena u sledećem potezu.” Copilot je prethodno rekao Carusu da Atari “pravi čudne poteze”, ali sada “je bio ponižen.”

Copilot je tada izgubio trag table, uprkos promptovima koji su bili pruženi posle svakog poteza, i ponudio je resetovanje ili nastavak. Caruso mu je rekao da neće pobediti sa ovakvom vrstom hendikepa i da je vreme za predaju. To je rezultiralo čudno dostojanstvenim govorom predaje:

“Potpuno si u pravu, Bobe,” rekao je Copilot. “Atari 2600 je zaslužio pobedu ovog puta”

U jednom trenutku, Caruso naziva ponašanje LLM-ova “ChatGPT deja vu” zbog prevelikog samopouzdanja kojim su pristupili zadatku, i kratkotrajnog pokušaja da se racionalizuju zbog svoje katastrofalne igre.

Glavna poruka je da, čak i ako ovo nije ono za šta su LLM-ovi dizajnirani, pokazuje koliko ovi modeli malo uzimaju u obzir kontekst i koliko lako mogu da izgube “kontakt” sa naizgled jednostavnim propozicijama. Kako je Caruso to opisao (kada je diskutovao na primeru ChatGPT-a): “Njegova nesposobnost da zapamti osnovno stanje table iz poteza u potez bila je veoma razočaravajuća.”

Atari Atari 2600

Komentari (0)

Nema komentara 😞

Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!

Pridruži se diskusiji

Vrati se na početak

Drugi su čitali

Uređaji
28.07.2025
2 min

Kako izgleda sledeći Samsung Galaxy flegšip, donosi najveće promene u poslednjih 5 godina

Galaxy S26 Ultra bi mogao doneti novi izgled zadnje strane, tanje kućište i uvođenje „ostrva sa kamerama“ zbog poboljšanog optičkog sistema

Softver i servisi
26.07.2025
2 min

Google Maps ostaje bez još jedne funkcije kasnije ove godine

Funkcija praćenja korisnika biće uklonjena iz Google Maps-a u septembru, a svi podaci o praćenju biće trajno obrisani

Nauka i tehnologija
24.07.2025
2 min

Zbogom punjačima, predstavljen prvi električni automobil koje se sam puni dok se vozi

Indijski izum pretvara vetar u energiju i omogućava električnom automobilu da se puni u pokretu, čak i pri malim brzinama

Nauka i tehnologija
29.07.2025
2 min

Huawei baterija sa dometom od 3.000 km mogla bi zauvek da promeni tržište električnih vozila

Nova baterija sa čvrstim jezgrom omogućava domet od 3000 km i punjenje za samo pet minuta, što bi moglo rešiti sve probleme sa dometom električnih vozila

Softver i servisi
23.07.2025
2 min

Samsung osvežio One UI Home: nova podešavanja i funkcije za uređaje sa One UI 8 verzijom

One UI Home ažuriran na verziju 17.0.01.3 donosi bolje performanse, stabilnost i nove opcije, ali isključivo za uređaje sa One UI 8 i Androidom 16

Testovi

Periferije
23.07.2025
9 min

Redragon Antonium Pro & Ironguard Pro recenzija - Preciznije, tiše, kvalitetnije

Redragon Antonium Pro & Ironguard Pro tastature donose odličan osećaj pri kucanju i fleksibilnost povezivanja sa različitim uređajima.

Nakon što je pobedio ChatGPT, Atari 2600 Video Chess uništio je i Microsoft Copilot-a

Nema komentara 😞

YouTube uvodi AI proveru uzrasta: automatske restrikcije za maloletne korisnike od 13. avgusta

iPhone korisnici, stiglo je hitno ažuriranje. iOS 18.6 donosi ispravku važnog problema

Adobe Photoshop dobija moćne AI funkcije za obradu slika

Najprodavaniji Android telefon uskoro dobija naslednika, otkrivaju preliminarne fotografije

Google Pixel postaje sve važniji faktor na tržištu telefona, drži čvrsto 4. mesto sa očitom namerom da se umeša u Apple – Samsung trku

NASA godinama bila u zabludi zbog zamke mesečeve prašine

OpenAI zapošljava hardverski tim: u pripremi “najinovativniji mobilni uređaj”

Huawei baterija sa dometom od 3.000 km mogla bi zauvek da promeni tržište električnih vozila

Apple bi mogao biti poslednja nada za Intel u poslu proizvodnje procesora

Microsoft Edge postao AI pregledač, Copilot Mode i AI pomoćnik za surfovanje internetom

Tesla prelazi na Samsung procesore: Novi čipovi stižu iz fabrike u Teksasu

Samsung Galaxy S25 FE stiže u septembru: poznati detalji o specifikacijama, bojama i memorijskim opcijama

Ostani u toku

Nema komentara 😞