GPT-4o donosi generisanje slika direktno u ChatGPT

OpenAI je integrisao generisanje slika u ChatGPT pomoću GPT-4o modela koji kombinuje tekstualno i vizuelno razumevanje u jednom sistemu, zamenivši DALL·E 3 i omogućivši korisnicima da kreiraju vizuelni sadržaj bez napuštanja čata

GPT-4o donosi generisanje slika direktno u ChatGPT

OpenAI je učinio još jedan korak ka ujedinjenju svojih AI sistema, najavljujući integraciju mogućnosti generisanja slika direktno u ChatGPT. Korisnici više neće morati da napuštaju čet interfejs da bi kreirali slike – sada sve obavlja jedan model, GPT-4o. Ova funkcija, predstavljena početkom nedelje, deo je šire inicijative kompanije da učini AI alate dostupnijim, svestranijim i korisnijim u različitim kontekstima – posebno u svetu vizuelne umetnosti, koji se konstantno razvija.

Do sada su korisnici ChatGPT-a imali pristup zasebnim modelima – tekst je dolazio iz GPT-a, a slike iz DALL-E 3 generatora. DALL·E 3 je zvanično predstavljen u septembru 2023, ali ga je zajednica AI entuzijasta ubrzo zamenila naprednijim alternativama kao što su MidJourney v6, Stable Diffusion 3.5, Flux i drugi. Sada, sa novom arhitekturom GPT-4o, OpenAI ukida DALL·E 3 kao odvojenu komponentu i prepušta sve zadatke jednom modelu koji je sposoban da “razume i stvara” kroz više modaliteta.

U zvaničnom blogu kompanije navodi se da GPT-4o odlično renderuje tekst unutar slika, precizno prati kompleksne upite korisnika i koristi znanje iz četa – uključujući prethodne poruke, kontekst i otpremljene slike – kao vizuelnu inspiraciju. Time OpenAI dalje razvija svoju ideju tzv. “omni” modela, univerzalnog sistema obučenog da podjednako dobro barata jezikom, slikom, zvukom i podacima.

Prijavi se na nedeljni Benchmark newsletter
Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

Sam Altman, direktor OpenAI-a, predstavio je mogućnosti nove funkcije u demonstracionom videu, u kojem je prikazano kako GPT-4o generiše strip stranicu koja objašnjava teoriju relativnosti na engleskom i mandarinskom, zatim personalizovane kolekcionarske karte izrađene od pravih fotografija korisnika, kao i unikatne komemorativne novčiće sa transparentnim pozadinama. Altman je posebno istakao jednu sliku nastalu iz izuzetno dugog i detaljnog opisa, kao primer preciznosti i kreativnog potencijala novog sistema.

Jedina očigledna mana za sada je brzina. GPT-4o generiše slike znatno sporije od DALL·E 3 modela, ali Altman naglašava da je drastično unapređen kvalitet vredan dodatnog čekanja. Za razliku od starijeg sistema koji prikazuje gotovu sliku nakon učitavanja, GPT-4o prikazuje sliku postepeno, odozgo na dole – što korisnicima omogućava da vide proces stvaranja u realnom vremenu.

Ali ova tehnologija nije ograničena samo na kreiranje umetničkih radova. Jedan od istraživača iz OpenAI tima, koji je učestvovao u razvoju nove funkcije, objašnjava da modeli sada mogu da vizuelizuju ono što znaju i pretoče to u korisne dijagrame, edukativne ilustracije, pa čak i u složene postere sa savršeno prikazanim tekstom. Sistem može da edituje slike, menja elemente a da pritom zadrži doslednost u tonu, stilu i sadržaju.

U pogledu bezbednosti, kompanija je implementirala sistem zaštite koji onemogućava kreiranje deepfake sadržaja, ilegalnih slika i pokušaje uklanjanja vodenih žigova. Iako slike neće imati vidljive oznake, svaka generisana slika nosi C2PA metapodatke, koji potvrđuju da je kreirana uz pomoć veštačke inteligencije. OpenAI takođe razvija dodatne alate za praćenje porekla slika i njihove distribucije.

Planovi uključuju proširenje funkcije na API nivo, što znači da će programeri uskoro moći da ugrade ovu mogućnost u svoje aplikacije. I na kraju, prema važećim pravilima korišćenja, korisnici zadržavaju vlasništvo nad generisanim slikama, pod uslovom da ih koriste u skladu sa politikom kompanije.

Integracija ovih mogućnosti u ChatGPT ne predstavlja samo tehnički napredak, već i korak ka redefinisanju načina na koji komuniciramo sa mašinama. GPT-4o ne samo da može da razume šta tražimo – on sada to može i da nacrta, prenosi decrypt.

Ostani u toku

Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

Komentari (0)

Nema komentara 😞

Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!

Pridruži se diskusiji
Možda vam se svidi