Kompaniji Nvidia nisu strane revolucionarne tehnologije, pa samo pogledajte njenu dominaciju na tržištu – svaka AI kompanija želi njene čipove. Ipak, sa jasno fokusiranim ciljem na veštačku inteligenciju, ova kompanija je nedavno predstavila svoju najnoviju zver – DGX GH200, najmoćniji GPU na planeti. Ali zašto je ovaj podvig neophodan i šta ga je motivisalo?
Najjednostavnije rečeno, razlog su sve veći zahtevi koje veštačka inteligencija nameće na tehnološki sektor. Novi čipovi konkurenata, kao što su AMD i Intel, bez obzira na njihov rastući tržišni udeo, trenutno ne prilaze blizu onome što Nvidia nudi, piše Redshark.
Pre nekoliko godina, Nvidia je kupila Mellanox, kompaniju specijalizovanu za proizvodnju mrežnih i interkonekcijskih rešenja visokih performansi. Korišćenjem ove tehnologije, Nvidia je kreirala revolucionarni GPU za datacentre, poznat kao A100 AI akcelerator, koji je bio neverovatno moćan.
Naslednik, A200, bio je još bolji. Ipak, oba modela su imala jedno zajedničko ograničenje, koje je karakteristično za sve GPU-ove: kapacitet memorije. Iako biste možda pomislili da je GPU sa 48, ili čak 96 GB memorije nešto izuzetno jako, ovo ne može da parira ekspanzivnim potrebama veštačke inteligencije.
Zašto je memorija važna za najmoćniji GPU i AI?
Memorija koja služi ekskluzivno za potrebe grafičkog procesora, igra ključnu ulogu u obuci veštačke inteligencije. Prvi aspekt važnosti GPU memorije je njen kapacitet za rukovanje velikim skupovima podataka koji su potrebni za obuku AI modela. Ovo je posebno bitno za duboke neuronske mreže koje zahtevaju brzi pristup ogromnim količinama informacija.
GPU memorija omogućava paralelno izvršavanje operacija. Ovo je bitno za AI obuku jer svaki jezgro GPU-a može izvršavati operacije nezavisno, što dovodi do veće efikasnosti i brzine obuke.
Poslednje, ali ne i manje važno, GPU memorija je brža od standardne RAM memorije, što omogućava brže izvršavanje operacija neophodnih za obuku AI modela.
Dakle, GPU memorija je esencijalna za obuku AI, jer omogućava efikasnu obradu velikih skupova podataka, podržava paralelno izvršavanje operacija i ubrzava proces obuke.
Na teren ulazi DGX GH200
Osnova Nvidia DGX GH200 je Grace Hopper Superchip, koji kombinuje 72-jezgarni ARM procesor sa Hopper GPU-om, povezanim kroz koherentni NVLink sa preko 900 GB/s propusnog opsega. Zahvaljujući ovoj kombinaciji, GPU može pristupiti ogromnom “baferu” od 600 GB LPDRAM (Low Power DRAM) memorije. Ovaj napredni dizajn omogućava spajanje do 256 Grace Hopper super-čipova, formirajući superkompjuter sa 144 TERABAJTA sistemske memorije i neverovatnim exaflopom računarske snage.
Ovo otvara vrata za obuku AI modela na nezamislivo velikim skupovima podataka – do 140 terabajta – i omogućava izvršavanje ogromnih neuronskih mreža sa posvećenom hardverskom podrškom. Dakle, DGX GH200 nije samo povećao maksimalnu veličinu skupova podataka za obuku, već je i dramatično ubrzao brzinu povratne petlje za obuku.
Još jedan aspekt koji odlikuje Nvidia DGX GH200 je njegova “cache” koherentnost. Sve CPU i GPU jedinice u superkompjuteru imaju potpuni pristup svakoj adresi memorije, što znači da iz perspektive programera, sistem deluje kao jedan veliki GPU, umesto grupe pojedinačnih. Ovo olakšava procesiranje i manipulaciju podacima, s obzirom da nema potrebe za vremenski zahtevnim zadacima podele podataka između različitih GPU jedinica.
Ukratko, Nvidia DGX GH200 predstavlja ogroman korak napred u obuci veštačke inteligencije, pružajući veće kapacitete za obradu podataka, brže vreme obrade i smanjujući složenost programiranja. Kako AI nastavlja da se razvija i raste, inovacije kao što je DGX GH200 će biti od suštinskog značaja za oblikovanje budućnosti ove tehnologije.
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji