Nvidia priznala da se završava era GPU-ova kakve smo do sada poznavali

Nvidijin strateški licencni dogovor sa kompanijom Groq, vredan oko 20 milijardi dolara, predstavlja jedan od prvih jasnih signala da se AI industrija nalazi pred velikim preokretom. Za inženjere i tehničke lidere koji danas grade AI sisteme i data centre, ova odluka šalje poruku da se era univerzalnog GPU-a kao standardnog rešenja za AI trening i odluke završava.

Industrija ulazi u fazu razdvojene AI arhitekture izvršavanja, u kojoj se sam silicijum deli na dve specijalizovane kategorije kako bi se odgovorilo na nove zahteve: obradu ogromnog konteksta i izuzetno brzo rezonovanje u realnom vremenu.

Ključni razlog za ovu promenu je sam proces izvršavanja i učenja AI modela. Krajem 2025. godine, izvršavanje AI modela je po prvi put premašio trening modela po ukupnim prihodima u data centrima. Time su se promenili i kriterijumi uspeha. Tačnost je postala osnovni uslov, dok se prava bitka sada vodi oko kašnjenja i sposobnosti sistema da zadrži stanje, što je ključno za autonomne AI agente.

Donošenje zaključaka AI modela se prirodno deli na dve faze. Prva je tzv. „prefill“ faza, u kojoj model „upija“ ogromne količine ulaznih podataka, poput velikih kodnih baza ili dugih video zapisa. Ova faza je izrazito računarski zahtevna i tu su GPU-ovi tradicionalno bili jaki. Druga faza je „decode“, odnosno generisanje odgovora token po token, gde je presudna brzina pristupa memoriji. Tu klasični GPU-ovi pokazuju ograničenja, a upravo tu dolazi do izražaja Groq-ova arhitektura zasnovana na SRAM memoriji.

Zašto proces AI treninga razbija klasičnu GPU arhitekturu

Nvidia je već najavila novu generaciju čipova iz porodice Vera Rubin, koji su projektovani upravo za ovakvu podelu posla. Prefill deo će koristiti pristupačniju GDDR7 memoriju za obradu ogromnih konteksta, dok će se za izuzetno brzu generaciju tokena oslanjati na specijalizovana rešenja inspirisana Groq tehnologijom.

SRAM memorija, koja je fizički ugrađena u sam procesor, omogućava ekstremno brzu obradu uz minimalnu potrošnju energije. Međutim, ona je skupa i ograničena prostorom, zbog čega je idealna za manje, ali brze modele, naročito u oblastima kao što su robotika, glasovne komande, IoT uređaji i edge AI. Upravo taj segment tržišta do sada nije bio adekvatno pokriven klasičnim GPU rešenjima.

Dodatni pritisak na Nvidiju dolazi i iz softverskog sveta. Uspeh kompanije Anthropic u razvoju prenosivog AI steka, koji bez većih problema radi i na GPU-ovima i na TPU-ovima, pokazao je da se zavisnost od jednog proizvođača može veoma lako razbiti. Nvidia dogovor sa Groq-om ima i jasnu defanzivnu ulogu: zadržati najosetljivije zadatke unutar CUDA ekosistema.

Posebno važan aspekt cele priče je stanje AI agenata, odnosno njihova sposobnost da pamte prethodne korake. U modernim agentnim sistemima, odnos ulaznih i izlaznih tokena može biti i 100 prema 1, što čini memoriju ključnim resursom. Ako se to stanje izgubi, sistem mora da troši ogromnu količinu energije da bi ga ponovo izračunao. Upravo tu SRAM i hijerarhijska memorijska rešenja dobijaju presudnu ulogu.

Zaključak za 2026. godinu je jasan: industrija ulazi u eru ekstremne specijalizacije. Umesto jednog dominantnog čipa, budućnost pripada arhitekturama koje precizno razdvajaju zadatke i šalju ih na odgovarajući hardverski nivo za potrebe brže obrade. Strategija više nije pitanje koji GPU je kupljen, već gde je svaki token obrađen i zašto, piše Zencoder.

nVidia AI GPU Veštačka inteligencija

Komentari (4)

nervic

04.01.2026

Smejurija, vratice se era samo tako..
- 0
uji

04.01.2026

Groktaće i ko neće! 😂
- 1
Mare

04.01.2026

Mene više čudi da do sada nisu otišli u tom pravcu, isto kao što je mining otišao na ASIC-e za mininig i tu grafičke nemaju šta da traže tako i AI mora da ode u tom smeru. Jedino logično. Šta će njemu RT, shading ROP i ostalo da računa matrice.
- 0
Gorgoyle927

06.01.2026

Инспиративан чланак који тера на размишљање, о томе где ће ићи развој технологије.

Оно што се зна је... да ће бити много различитих чипова! А не као данас Нвидија, АМД, Интел и ништа више. Свако битан у свету, прави своје чипове и правиће.
- 0

Pridruži se diskusiji

Komentari su zatvoreni.

Vrati se na početak

Drugi su čitali

Softver i servisi
13.04.2026
3 min

Android 17: Objavljena lista modela na koje stiže update

Android 17 stiže na brojne pametne telefone, a objavljena je i lista modela koji će dobiti nadogradnju i onih koji ostaju bez dalje podrške

Gejming
17.04.2026
2 min

Sony PS6 donosi punu kompatibilnost sa prethodnim modelima i neočekivano nisku cenu

Sony PS6 donosi podršku za PS4 i PS5 igre, RDNA 5 arhitekturu i znatno niže troškove proizvodnje uz agresivnu cenu

Gejming
15.04.2026
3 min

PlayStation 6 u 3 verzije: Glavna, jeftinija i ručna konzola

Izgleda da kompanija Sony planira tri PS6 uređaja za 2027. godinu, a uz budžetski PlayStation 6 model stižu i flagship konzola i handheld

Softver i servisi
16.04.2026
2 min

Samsung One UI 9 je sledeće veliko ažuriranje softvera, ovo je spisak svih Galaxy uređaja koji ga dobijaju

One UI 9 baziran na Android 17 verziji stiže na brojne Galaxy uređaje, uključujući: S, Z, A i Tab serije

Uređaji
11.04.2026
2 min

Reagovao Apple: Viralne Artemis II fotografije označene „Shot on iPhone“

Apple obeležio Artemis II fotografije kao „Shot on iPhone“, nakon što su astronauti koristili iPhone 17 Pro Max za snimanje iz svemira

Testovi

Telefoni
15.04.2026
8 min

Motorola G77 - u skladu sa očekivanjima

Na test Benchmark redakcije stigao je još jedan predstavnik G serije sa kojom se družimo već duži niz godina – Motorola G77. Koliko i šta nudi?

Pametni satovi
06.04.2026
10 min

Ne samo za trčanje - Huawei Watch GT Runner 2 recenzija

Huawei Watch GT Runner 2 je pametni sat namenjen trčanju, ali sa mogućnostima koje ga preporučuju svima. Kako radi, pročitajte u našoj recenziji.

Nvidia priznala da se završava era GPU-ova kakve smo do sada poznavali

Zašto proces AI treninga razbija klasičnu GPU arhitekturu

USB trik za pametne televizore i kako zaobići ograničenje od 100 Mbps na Ethernet portu

Novi izveštaj otkriva da Apple i Google aktivno promovišu aplikacije za “razgolićavanje” kroz pretragu i oglase

Potvrđene zvanične Motorola Edge 70 Pro specifikacije - stiže sa 144 Hz ekranom i baterijom od 6500 mAh

Gemini postaje novi „šerif“ sa zadatkom u Google Maps-u - AI od sada briše lažne recenzije pre objave

Novi procesori utiču na sve veći jaz između modela, Pro Max telefoni dobijaju maksimum, dok standardne verzije postaju slabije

Ryzen 9 9950X3D2 - prvi testovi još uvek ne otkrivaju puni potencijal, jer veliki dual 3D cache ostaje nepopunjen

Anthropic uvodi proveru identiteta za Claude, korisnici zabrinuti za privatnosti

TSMC reagovao na planove Intel - Mask koalicije: u trci za 2 nm nema brzih prečica

Sony PS6 donosi punu kompatibilnost sa prethodnim modelima i neočekivano nisku cenu

Od rekreativnog trčanja do vrhunskih rezultata: Huawei Watch GT Runner 2 kao lični trener na zglobu

Nvidia CEO upozorava na skrivene data centre u Kini

Google radi na Pixel „laptopu” i „Pixel Glow” osvetljenju koje stiže i na telefone

Zašto proces AI treninga razbija klasičnu GPU arhitekturu

Ostani u toku