Tokom proteklog vikenda, priča o kineskom startupu DeepSeek eksplodirala je u svetu veštačke inteligencije. Njihov novi AI model, nazvan “DeepSeek R1”, izazvao je buru reakcija u industriji, investitorima i među najvećim tehnološkim kompanijama. Ovaj model, koji je besplatan, uglavnom open-source i navodno bolji od najnovijih dostupnih modela kompanija poput OpenAI i Meta, postao je glavna tema razgovora.
Ono što čini DeepSeek-ove modele toliko posebnim jeste činjenica da su dostupni svima za preuzimanje, modifikaciju i korišćenje u bilo koje svrhe. Za razliku od OpenAI-jevih modela, koji su dostupni samo na njihovoj platformi i za koje se naplaćuje znatna cena, DeepSeek omogućava korisnicima da hostuju modele na sopstvenom hardveru. Ovo je posebno privlačno za industrije koje rukuju osetljivim podacima.
Pored toga, DeepSeek nudi i hostovan pristup svojim modelima, ali po znatno nižoj ceni. Dok OpenAI naplaćuje 15 dolara za milion “tokena” (delova teksta koji se unose u model), DeepSeek naplaćuje samo 0,14 dolara za istu količinu. Ova razlika u cenama može imati ogroman uticaj na kompanije koje koriste AI u velikim količinama.
Revolucionarni pristup obuci modela
Jedan od najimpresivnijih aspekata ove priče jeste način na koji je DeepSeek uspeo da obuči svoje modele. Prema izjavama istraživača, obuka osnovnog modela DeepSeek-V3 koštala je samo 5,6 miliona dolara, koristeći 2.048 Nvidia H800 GPU-ova. Za poređenje, Meta je koristila preko 600.000 snažnijih Nvidia H100 GPU-ova za obuku svog modela Llama 3, a planira da do kraja godine bude u posedu čak 1,3 miliona GPU-ova.
Uporedo sa tim, DeepSeek-ov model zahtevao je 2,78 miliona GPU časova, dok je Llama 3 zahtevao 30,8 miliona GPU časova. I pored manjih resursa, DeepSeek-ovi modeli ne samo da su se pokazali jednako dobrim, već su u nekim slučajevima nadmašili modele OpenAI i Meta, posebno u matematičkim i programerskim testovima.
Sputnik moment za AI industriju?
Ova priča dobila je dodatni zamah kada je DeepSeek-ov chatbot aplikacija tokom vikenda dostigla vrh liste besplatnih aplikacija na iOS App Store-u. Mnogi posmatrači ovo nazivaju “Sputnik momentom” u globalnoj trci za dominaciju u oblasti veštačke inteligencije. Međutim, postoji i zabrinutost u vezi sa pitanjem privatnosti, jer se podaci korisnika šalju u Kinu, a chatbot je podložan kineskim cenzorskim politikama.
Ovi razvoji izazvali su paniku u najvećim tehnološkim kompanijama. Prema izveštajima, unutar Mete formiran je “ratni štab” kako bi se razmotrila nova AI strategija. S druge strane, nova američka administracija, koja je imala ambicije da dominira u oblasti AI-ja, verovatno neće biti zadovoljna ovim razvojem događaja.
DeepSeek-ov uspeh dovodi u pitanje opravdanost ogromnih ulaganja u AI infrastrukturu, uključujući hiljade GPU-ova i gigantske data centre. Ako se pokaže da je ovaj pristup efikasniji i jeftiniji, industrija će morati da se prilagodi novoj realnosti.
Dok se događaji brzo odvijaju, jedno je sigurno: DeepSeek je postavio nove standarde u svetu veštačke inteligencije, a njihov uticaj će se osetiti u godinama koje dolaze, prenosi Sherwood.
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji