Kineski AI startup DeepSeek ubrzava razvoj svog naprednog modela sledeće generacije sa oznakom R2, koji bi trebalo da nasledi januarski R1 model. Prema informacijama bliskim kompaniji, prvobitni plan je bio da se model objavi početkom maja, ali sada se ide što ranije sa lansiranjem. Očekuje se da će novi model doneti poboljšanja u programiranju i proširiti sposobnost rezonovanja na više jezika osim engleskog.
DeepSeek je postao poznat po tome što je sa jeftinijim AI modelom izazvao potres na globalnim berzama, obarajući vrednost tehnoloških giganata za preko trilion dolara. Njegov R1 model je konkurentan iako koristi slabije Nvidia procesore u poređenju sa modelima koji su razvijani uz investicije od stotine milijardi dolara najvećih američkih kompanija.
Vijayasimha Alilughatta, operativni direktor indijske kompanije Zensar, ističe da bi lansiranje modela R2 moglo biti ključni trenutak za AI industriju, jer bi DeepSeek mogao podstaći globalne kompanije da ubrzaju razvoj jeftinijih, ali efikasnih AI rešenja.
Uspon DeepSeek-a i uticaj na geopolitičku scenu
Američka vlada pažljivo prati situaciju, s obzirom na to da je razvoj veštačke inteligencije postao nacionalni prioritet. DeepSeek je već integrisan u proizvode brojnih kineskih kompanija, dok se vlasti u Pekingu sve više oslanjaju na njegove modele.
Iako je kompanija relativno nepoznata, njen osnivač, Liang Wenfeng, već je postao milijarder zahvaljujući svom „hedge“ fondu High-Flyer. Liang je poznat po povučenom stilu i izbegavanju javnosti – poslednji put je govorio za medije u julu 2024. godine. Analize pokazuju da DeepSeek funkcioniše više kao istraživačka laboratorija nego kao klasična profitna kompanija, izbegavajući strogu hijerarhiju karakterističnu za kineske tehnološke gigante.
Liang se ranije suprotstavio trendu ulaganja u potrošačke AI aplikacije, fokusirajući se na poboljšanje osnovnih modela. Njegove kompanije nude natprosečne plate kako bi privukle vrhunske talente, što je omogućeno prihodima od High-Flyera.
Ključ uspeha – moćna računarska infrastruktura
DeepSeek je uspeo da razvije konkurentan AI model zahvaljujući višegodišnjim ulaganjima u računarsku moć. Još 2020. i 2021. godine High-Flyer je potrošio 1,2 milijarde juana na dva superkompjutera, od kojih je jedan koristio oko 10.000 Nvidia A100 čipova. To je privuklo pažnju kineskih regulatora, koji su isprva ispitivali svrhu tolikog ulaganja u AI, ali su kasnije odlučili da ne intervenišu. Ova odluka se pokazala ključnom, jer je 2022. godine SAD zabranio izvoz naprednih Nvidia čipova u Kinu, dok je DeepSeek već imao operativnu infrastrukturu.
Neki zapadni stručnjaci spekulišu da kompanija možda ima pristup i zabranjenim čipovima, ali za sada ne postoje dokazi za takve tvrdnje. Ono što se zna jeste da je DeepSeek razvio efikasniju arhitekturu koristeći metode poput Mixture-of-Experts (MoE) i Multihead Latent Attention (MLA), što im omogućava da zadrže niže troškove u procesu obrade podataka.
Globalne reakcije i budućnost DeepSeeka
DeepSeek je već integrisan u sisteme kineskih državnih institucija i kompanija kao što su Lenovo, Baidu i Tencent. Peking podržava kompaniju, ali joj je naloženo da ne daje izjave bez prethodnog odobrenja vlasti.
Dok Kina promoviše DeepSeek kao primer tehnološke samostalnosti, zapadne zemlje, uključujući Italiju i Južnu Koreju, već su uklonile njegove modele iz svojih digitalnih ekosistema, pozivajući se na zabrinutost oko privatnosti. Američki eksperti upozoravaju da bi široko usvajanje DeepSeek AI modela moglo podstaći dalju eskalaciju restrikcija na izvoz čipova i softversku saradnju između Zapada i Kine.
Uprkos ovim izazovima, DeepSeek nastavlja da razvija svoje modele i uz ubrzanu objavu R2, mogao bi dodatno uzdrmati globalno AI tržište, prenose Reuters.
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji