Kineska kompanija za video igre i društvene mreže, Tencent Holdings, lansirala je alat za generisanje videa iz teksta nazvan HunyuanVideo, baziran na svom Hunyuan baznom modelu veštačke inteligencije. Ovim potezom, Tencent se pridružuje sve intenzivnijoj trci među domaćim rivalima koji žele da izazovu američke konkurente u ovoj oblasti.
HunyuanVideo je od utorka dostupan besplatno kako poslovnim, tako i individualnim korisnicima, saopštila je kompanija. Sa preko 13 milijardi parametara – što predstavlja meru promenljivih u AI sistemu tokom treninga – HunyuanVideo je najveći open-source model za generisanje videa na svetu, tvrdi Tencent.
Alat je dizajniran da proizvodi visokokvalitetne, “hiperrealistične” videe u kojima su promene uglova kamere i refleksije verodostojno prikazane. U jednom demonstracionom videu, surfer jaše veliki talas i izvodi okrete, dok u drugom klipu nekoliko balona na vruć vazduh polako uzleće ka nebu dok logorske vatre gore na tlu.
Tencent, vlasnik najkorišćenije aplikacije za društvene mreže u Kini i najveće kompanije za video igre po prihodima na svetu, najnoviji je kineski tehnološki gigant koji ulazi u AI bitku u generisanju videa. Ovo dolazi nakon što je OpenAI, kreator ChatGPT-a, predstavio Sora u februaru.
HunyuanVideo će morati da se bori u izuzetno oštroj konkurenciji
Operater aplikacije za kratke videe, Kuaishou Technology, glavni rival kompanije ByteDance u Kini, lansirao je svoju uslugu za generisanje videa iz teksta pod nazivom Kling AI Model u junu. E-trgovinski gigant Alibaba Group Holding, vlasnik lista South China Morning Post, radi na AI alatu za video pod nazivom Tora, koji koristi OpenAI-jev OpenSora kao osnovni model.
Tencentov HunyuanVideo model baziran je na arhitekturi Diffusion Transformer, istoj tehnologiji koja pokreće Sora.
Prema testovima koje je sproveo South China Morning Post u utorak, HunyuanVideo može kreirati videe do pet sekundi dužine u 720p rezoluciji. Na osnovu tekstualnih upita na engleskom ili kineskom, alat je uspeo da generiše realističan video kineske kuvarice koja baca hranu u vazduh i animirani klip mačke u sajberpank pejzažu. Ipak, nisu sve akcije navedene u upitima bile uključene u rezultate.
Korisnici mogu isprobati HunyuanVideo preko Yuanbao, Tencentove AI chatbot aplikacije, koja prihvata tekstualne upite na kineskom ili engleskom jeziku i nudi različite opcije za stil videa, kvalitet i veličinu. Takođe omogućava izbor naprednih opcija za snimanje, poput različitih pokreta kamere i kadrova.
Od predstavljanja svog Hunyuan osnovnog modela u septembru prošle godine, Tencent je lansirao niz nadogradnji. U martu je predstavio alat za pretvaranje slike u video nazvan Follow-Your-Click, u saradnji sa Hongkonškim univerzitetom za nauku i tehnologiju i Univerzitetom Tsinghua. U maju je kompanija dodala mogućnost generisanja slike iz teksta Hunyuan modelu, poboljšavajući njegove ukupne performanse za 20% u odnosu na prethodnu verziju.
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji