Prema rečima izvršnog direktora Jensena Huanga, Nvidia je uspešno ispravila grešku u dizajnu svojih najnovijih Blackwell AI čipova. Problem, koji je izazvao kašnjenja u proizvodnji, rešen je uz pomoć TSMC-a, dugogodišnjeg proizvodnog partnera Nvidije. Zapravo, TSMC je bio taj koji je prvobitno uočio problem.
Prevazilaženje ovog problema bilo je ključno za Nvidiju, jer želi da zadrži svoju dominantnu poziciju na tržištu AI čipova. Kako potražnja za hardverom za obradi AI-a nastavlja da raste, uspešno lansiranje Blackwell-a će igrati ključnu ulogu u obezbeđivanju potrebnog hardvera visokih performansi.
Huang je otvoreno priznao odgovornost kompanije za zastoj. “Imali smo grešku u dizajnu u Blackwell-u”, rekao je. “Bio je funkcionalan, ali je greška u dizajnu uzrokovala nisku iskorišćenost. To je bila 100 odsto greška Nvidije.”
Blackwell čipovi, predstavljeni u martu, prvobitno su bili planirani za isporuku u drugom kvartalu. Međutim, greška u dizajnu dovela je do kašnjenja, potencijalno utičući na velike kupce kao što su Meta, Google i Microsoft.
Nvidia – imali smo grešku u dizajnu u Blackwell-u
Projekat Blackwell je bio neuobičajeno složen, rekao je Huang, što je možda bio faktor u grešci. “Da bi Blackwell računar radio, sedam različitih tipova čipova je dizajnirano od nule i morali su istovremeno da uđu u proizvodnju.”
Tehnički problem je proistekao iz složene tehnologije pakovanja korišćene u Blackwell B100 i B200 GPU-ovima. Ovi čipovi koriste TSMC-ovo CoWoS-L pakovanje, koje koristi RDL interposer sa lokalnim silicijumskim međuvezama da postigne brzine prenosa podataka od oko 10 TB/s. Problem je nastao zbog neusklađenosti u svojstvima toplotne ekspanzije između različitih komponenti, što je izazvalo deformaciju sistema i kvar.
Da bi to rešila, Nvidia je modifikovala gornje metalne slojeve i izbočine na GPU silicijumu, poboljšavajući proizvodni prinos. Iako konkretni detalji popravke ostaju neotkriveni, kompanija je potvrdila da su bile potrebne nove maske.
Brzina rešavanja je vredna pažnje. Obično, rešavanje takvih problema u industriji poluprovodnika uključuje modifikaciju metalnih slojeva i stvaranje novih verzija, proces koji može trajati oko tri meseca. “Ono što je TSMC uradio je da nam pomogne da se oporavimo od tih problema i nastavimo proizvodnju Blackwell-a neverovatnom brzinom”, rekao je Huang.
Sa sada ispravljenom greškom u dizajnu, masovna proizvodnja popravljenih Blackwell GPU-ova treba da počne krajem oktobra. Očekuje se da će isporuke početi početkom 2025. godine, što se poklapa sa fiskalnom godinom Nvidije.
Uprkos zastoju, potražnja za Blackwell čipovima ostaje visoka. Huang je ranije opisao potražnju kao “ludu”, sa kupcima koji su željni da budu prvi u redu za novu tehnologiju.
Google je naručio preko 400.000 GB200 čipova u ugovoru vrednom preko 10 milijardi dolara. Slično tome, Meta je postavila narudžbinu od 10 milijardi dolara, dok će Microsoft dobiti između 55.000 i 65.000 GB200 GPU-ova spremnih za OpenAI do prvog kvartala 2025. godine, prenosi TechSpot.
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji