Kineski DeepSeek potresa svet AI-ja: Besplatni i bolji modeli izazvali paniku u industriji

Otkrijte kako je kineski startup DeepSeek potresao industriju veštačke inteligencije svojim besplatnim, open-source modelom DeepSeek R1

Kineski DeepSeek potresa svet AI-ja: Besplatni i bolji modeli izazvali paniku u industriji

Tokom proteklog vikenda, priča o kineskom startupu DeepSeek eksplodirala je u svetu veštačke inteligencije. Njihov novi AI model, nazvan “DeepSeek R1”, izazvao je buru reakcija u industriji, investitorima i među najvećim tehnološkim kompanijama. Ovaj model, koji je besplatan, uglavnom open-source i navodno bolji od najnovijih dostupnih modela kompanija poput OpenAI i Meta, postao je glavna tema razgovora.

Ono što čini DeepSeek-ove modele toliko posebnim jeste činjenica da su dostupni svima za preuzimanje, modifikaciju i korišćenje u bilo koje svrhe. Za razliku od OpenAI-jevih modela, koji su dostupni samo na njihovoj platformi i za koje se naplaćuje znatna cena, DeepSeek omogućava korisnicima da hostuju modele na sopstvenom hardveru. Ovo je posebno privlačno za industrije koje rukuju osetljivim podacima.

Pored toga, DeepSeek nudi i hostovan pristup svojim modelima, ali po znatno nižoj ceni. Dok OpenAI naplaćuje 15 dolara za milion “tokena” (delova teksta koji se unose u model), DeepSeek naplaćuje samo 0,14 dolara za istu količinu. Ova razlika u cenama može imati ogroman uticaj na kompanije koje koriste AI u velikim količinama.

Revolucionarni pristup obuci modela

Jedan od najimpresivnijih aspekata ove priče jeste način na koji je DeepSeek uspeo da obuči svoje modele. Prema izjavama istraživača, obuka osnovnog modela DeepSeek-V3 koštala je samo 5,6 miliona dolara, koristeći 2.048 Nvidia H800 GPU-ova. Za poređenje, Meta je koristila preko 600.000 snažnijih Nvidia H100 GPU-ova za obuku svog modela Llama 3, a planira da do kraja godine bude u posedu čak 1,3 miliona GPU-ova.

Uporedo sa tim, DeepSeek-ov model zahtevao je 2,78 miliona GPU časova, dok je Llama 3 zahtevao 30,8 miliona GPU časova. I pored manjih resursa, DeepSeek-ovi modeli ne samo da su se pokazali jednako dobrim, već su u nekim slučajevima nadmašili modele OpenAI i Meta, posebno u matematičkim i programerskim testovima.

Sputnik moment za AI industriju?

Ova priča dobila je dodatni zamah kada je DeepSeek-ov chatbot aplikacija tokom vikenda dostigla vrh liste besplatnih aplikacija na iOS App Store-u. Mnogi posmatrači ovo nazivaju “Sputnik momentom” u globalnoj trci za dominaciju u oblasti veštačke inteligencije. Međutim, postoji i zabrinutost u vezi sa pitanjem privatnosti, jer se podaci korisnika šalju u Kinu, a chatbot je podložan kineskim cenzorskim politikama.

Prijavi se na nedeljni Benchmark newsletter
Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

Ovi razvoji izazvali su paniku u najvećim tehnološkim kompanijama. Prema izveštajima, unutar Mete formiran je “ratni štab” kako bi se razmotrila nova AI strategija. S druge strane, nova američka administracija, koja je imala ambicije da dominira u oblasti AI-ja, verovatno neće biti zadovoljna ovim razvojem događaja.

DeepSeek-ov uspeh dovodi u pitanje opravdanost ogromnih ulaganja u AI infrastrukturu, uključujući hiljade GPU-ova i gigantske data centre. Ako se pokaže da je ovaj pristup efikasniji i jeftiniji, industrija će morati da se prilagodi novoj realnosti.

Dok se događaji brzo odvijaju, jedno je sigurno: DeepSeek je postavio nove standarde u svetu veštačke inteligencije, a njihov uticaj će se osetiti u godinama koje dolaze, prenosi Sherwood.

Ostani u toku

Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

Komentari (0)

Nema komentara 😞

Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!

Pridruži se diskusiji
Možda vam se svidi