Sora je novi AI model kompanije OpenAI za kreiranje video zapisa na osnovu teksta

Najnoviji AI model kompanije OpenAI – Sora, prima tekstualne upite i pretvara ih u složene video scene sa više likova, specifičnim pokretima i scenografijom

Sora je novi AI model kompanije OpenAI za kreiranje video zapisa na osnovu teksta

Razvoj veštačke inteligencije u video produkciji dostigao je novu fazu lansiranjem Sora AI modela kompanije OpenAI, koja je inače i tvorac popularnog ChatGPT bota. Sora je najnoviji član porodice modela veštačke inteligencije i donosi inovacije u transformisanju teksta u kompleksne video scene sa više likova, specifičnim pokretima i živopisnim detaljima. Ovaj „tekst-u-video” model omogućava korisnicima kreiranje fotorealističnih video zapisa, pri čemu je  sve bazirano na napisanim upitima.

OpenAI na svom blogu ističe da Sora može da stvara složene scene koje obuhvataju više likova, precizne pokrete i detaljne pozadine, istovremeno razumevajući kako objekti postoje u fizičkom svetu. Ovaj model takođe pokazuje sposobnost preciznog tumačenja rekvizita i generisanja ubedljivih likova sa izraženim emocijama. Demo snimci sa sajta kompanije koje je generisao Sora uključuju pejzaž Kalifornije koji je nastao u vreme „zlatne groznice”, video snimak iz voza u Tokiju i mnoge druge.

Neki od njih pokazuju znakove koji odaju da je u pitanju kreacija veštačke inteligencije, kao što je sumnjivo pomeranje poda na video snimku muzeja. OpenAI kaže da model trenutno ima izazov sa preciznom simulacijom fizike pokreta u složenijim scenama, ali da su rezultati prilično impresivni.

Pre nekoliko godina, generatori teksta u sliku kao što je Midjourney, bili su u vrhu sposobnosti modela da pretvaraju reči u sliku. Kompanije kao što su Runway i Pika, pokazala su impresivne modele pretvaranja „teksta u video”. Takođe, tu je i Lumiere kompanije Google koji je jedan od primarnih konkurenata firmi OpenAI. Slično kao kod modela Sora, Lumiere korisnicima daje alate za pretvaranje teksta u video omogućavajući im kreaciju video zapisa od nepokretne slike.

Sora nije dostupna široj publici, već je trenutno rezervisana za „crvene timove stručnjaka” koji ocenjuju potencijalne rizike i štete veštačke inteligencije. OpenAI takođe je dozvolila pristup modelu nekim vizuelnim umetnicima, dizajnerima i filmskim stvaraocima, sve u cilju da dobije povratne informacije. Kompanija dalje naglašava da model u početku neće moći savršeno da simulira fiziku složenih scena i može imati izazove sa tumačenjem određenih uzročno-posledičnih situacija.

Ranije ovog meseca, OpenAI je najavio da dodaje vodene žigove svom alatu za pretvaranje teksta u sliku, DALL-E 3, ali ipak napominje da se oni lako mogu ukloniti. Kao i drugi proizvodi na bazi veštačke inteligencije, OpenAI i u ovom slučaju mora da se bori sa posledicama lažnih, AI fotorealističnih video snimaka koji se pogrešno smatraju originalnim.

Ovo je tek početak priče u koju je uključena veštačka inteligencija i njeni napredni alati koji su naizgled bezopasni. Ne treba zaboraviti da uvek postoji mogućnost da oni mogu da izazovu niz loših posledica u društvu, ali, naravno, ukoliko ne budu kontrolisani od strane čoveka.

Ostani u toku

Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

Komentari (0)

Nema komentara 😞

Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!

Pridruži se diskusiji
Možda vam se svidi