Dolazi DeepSeek R2 model i preti ozbiljnim potresima na svetskom tržištu veštačke inteligencije

Pojavile se glasine o DeepSeek R2 AI modelu; navodno 97% niži troškovi od GPT-4 i potpuno treniran na Huawei Ascend čipovima

Dolazi DeepSeek R2 model i preti ozbiljnim potresima na svetskom tržištu veštačke inteligencije

Izgleda da će kineska kompanija DeepSeek uskoro predstaviti novi model, jer su se na internetu pojavile informacije o njihovom sledećem modelu pod nazivom DeepSeek R2.

DeepSeek R2 bi mogao ponovo uzdrmati tržište veštačke inteligencije jer je navodno treniran prevashodno na Huawei AI procesorima. Prvi komercijalni model kompanije DeepSeek, R1, pokazao je zapadnom svetu da Kina nije zaostala u razvoju vrhunskih AI sistema. Njegovo lansiranje izazvalo je šok na američkom berzanskom tržištu, što je rezultiralo gubicima vrednosti u milijardama dolara, ali je i pokazalo da razvoj AI modela ne mora nužno biti skup proces, kako su to tvrdile zapadne kompanije poput OpenAI-a. Sada kineski mediji izveštavaju o glasinama koje prate dolazak DeepSeek R2 modela, koji bi mogao ponovo iznenaditi zapadne AI gigante.

Važno je napomenuti da sve informacije treba uzeti sa rezervom, jer DeepSeek još nije zvanično potvrdio podatke o novom modelu. Prema dostupnim izvorima, R2 će koristiti hibridnu arhitekturu MoE (Mixture of Experts), unapređenu verziju postojeće MoE implementacije, verovatno sa naprednim mehanizmima za usmeravanje rada ili kombinacijom MoE i gustih slojeva kako bi se optimizovali složeni zadaci. Zahvaljujući toj arhitekturi, očekuje se da R2 ima dvostruko više parametara u odnosu na R1, odnosno čak 1,2 biliona.

Samo na osnovu tog podatka, R2 bi mogao biti rival modelima poput GPT-4 Turbo i Google Gemini 2.0 Pro. Ali to nije jedino polje na kojem DeepSeek planira da ostavi snažan utisak. Navodi se da će R2 imati troškove po tokenu čak 97,4% niže od GPT-4, sa cenom od 0,07 dolara po milionu ulaznih tokena i 0,27 dolara po milionu izlaznih tokena. U poređenju sa cenama koje nudi OpenAI, DeepSeek R2 će biti izuzetno isplativa opcija za preduzeća, što bi moglo ozbiljno promeniti ekonomiju veštačke inteligencije.

Prijavi se na nedeljni Benchmark newsletter
Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

Još jedna zanimljiva informacija jeste da će DeepSeek R2 ostvariti 82% iskorišćenosti Huawei-evih Ascend 910B čipova, pri ukupnoj računarskoj snazi od 512 petaFLOPS-a na FP16 preciznosti, što potvrđuje da se DeepSeek odlučio za korišćenje domaćih resursa u razvoju svog sledećeg velikog modela. Poznato je da je DeepSeek već duže vreme pokazivao veliko interesovanje za Huawei AI čipove, pa se može reći da je ovim potezom kompanija praktično vertikalno integrisala ceo svoj AI lanac snabdevanja.

Treba još jednom istaći da su sve ove informacije za sada na nivou spekulacija i da krajnji model može biti drugačiji. Ipak, ako su izveštaji kineskih medija tačni, DeepSeek R2 bi mogao predstavljati još jedno iznenađenje za najveće svetske kompanije u oblasti veštačke inteligencije, piše Wccftech.

Ostani u toku

Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

Komentari (0)

Nema komentara 😞

Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!

Pridruži se diskusiji
Možda vam se svidi
Polisa privatnosti

Ova veb stranica koristi kolačiće kako bismo vam pružili najbolje moguće korisničko iskustvo.

Informacije o kolačićima se čuvaju u vašem pretraživaču i obavljaju funkcije poput prepoznavanja kada se vratite na našu veb stranicu i pomažu našem timu da razume koje delove veb sajta smatrate najzanimljivijim i najkorisnijim.