Izgleda da će kineska kompanija DeepSeek uskoro predstaviti novi model, jer su se na internetu pojavile informacije o njihovom sledećem modelu pod nazivom DeepSeek R2.
DeepSeek R2 bi mogao ponovo uzdrmati tržište veštačke inteligencije jer je navodno treniran prevashodno na Huawei AI procesorima. Prvi komercijalni model kompanije DeepSeek, R1, pokazao je zapadnom svetu da Kina nije zaostala u razvoju vrhunskih AI sistema. Njegovo lansiranje izazvalo je šok na američkom berzanskom tržištu, što je rezultiralo gubicima vrednosti u milijardama dolara, ali je i pokazalo da razvoj AI modela ne mora nužno biti skup proces, kako su to tvrdile zapadne kompanije poput OpenAI-a. Sada kineski mediji izveštavaju o glasinama koje prate dolazak DeepSeek R2 modela, koji bi mogao ponovo iznenaditi zapadne AI gigante.
Važno je napomenuti da sve informacije treba uzeti sa rezervom, jer DeepSeek još nije zvanično potvrdio podatke o novom modelu. Prema dostupnim izvorima, R2 će koristiti hibridnu arhitekturu MoE (Mixture of Experts), unapređenu verziju postojeće MoE implementacije, verovatno sa naprednim mehanizmima za usmeravanje rada ili kombinacijom MoE i gustih slojeva kako bi se optimizovali složeni zadaci. Zahvaljujući toj arhitekturi, očekuje se da R2 ima dvostruko više parametara u odnosu na R1, odnosno čak 1,2 biliona.
Samo na osnovu tog podatka, R2 bi mogao biti rival modelima poput GPT-4 Turbo i Google Gemini 2.0 Pro. Ali to nije jedino polje na kojem DeepSeek planira da ostavi snažan utisak. Navodi se da će R2 imati troškove po tokenu čak 97,4% niže od GPT-4, sa cenom od 0,07 dolara po milionu ulaznih tokena i 0,27 dolara po milionu izlaznih tokena. U poređenju sa cenama koje nudi OpenAI, DeepSeek R2 će biti izuzetno isplativa opcija za preduzeća, što bi moglo ozbiljno promeniti ekonomiju veštačke inteligencije.
Još jedna zanimljiva informacija jeste da će DeepSeek R2 ostvariti 82% iskorišćenosti Huawei-evih Ascend 910B čipova, pri ukupnoj računarskoj snazi od 512 petaFLOPS-a na FP16 preciznosti, što potvrđuje da se DeepSeek odlučio za korišćenje domaćih resursa u razvoju svog sledećeg velikog modela. Poznato je da je DeepSeek već duže vreme pokazivao veliko interesovanje za Huawei AI čipove, pa se može reći da je ovim potezom kompanija praktično vertikalno integrisala ceo svoj AI lanac snabdevanja.
Treba još jednom istaći da su sve ove informacije za sada na nivou spekulacija i da krajnji model može biti drugačiji. Ipak, ako su izveštaji kineskih medija tačni, DeepSeek R2 bi mogao predstavljati još jedno iznenađenje za najveće svetske kompanije u oblasti veštačke inteligencije, piše Wccftech.
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji