ARM, Intel i Nvidia su zajednički napisali i usvojili dokument koji opisuje operacije sa 8-bitnim brojevima i pokretnim zarezom (FP8) kao i dve varijante E5M2 i E4M3, a sve u cilju nastojanja da obezbede zajednički format koji se može koristiti u ključne dve svrhe: učenje veštačke inteligencije (AI) i za donošenje odluka. Ovo industrijsko usklađivanje specifikacija će omogućiti modelima veštačke inteligencije kompatibilnost i odgovarajući nivo performansi na različitim hardverskim platformama, čime se ubrzava razvoj AI softvera.
Računski zahtevi u cilju daljeg razvoja veštačke inteligencije, rastu eksponencijalnom brzinom. Potrebne su nove inovacije na polju hardvera i softvera, kako bi se obezbedila dovoljna računska snaga i količina podataka u svrhu daljeg unapređenja veštačke inteligencije.
Jedna od oblasti istraživanja koja obećava konačno rešenje ovog rastućeg problema je smanjenje zahteva za numeričkom preciznošću u svrhu učenja veštačke inteligencije kako bi se poboljšalo pamćenje i računarska efikasnost. Metoda smanjene preciznosti koristi bitna svojstva otpornosti na smetnje u radu neuronskih mreža u cilju poboljšanja efikasnosti rada računara.
Intel planira da podrži ovu specifikaciju i uvrsti je u planove za buduće AI proizvode poput CPU, GPU i druge AI akceleratore, uključujući Habana Gaudi akceleratore mašinskog učenja.
FP8 smanjuje na najmanju moguću meru odstupanja od postojećih IEEE 754 formata sa pokretnim zarezom uz dobar balans iskorišćenosti hardvera i softvera, kako bi se iskoristila postojeća dostignuća, ubrzala implementacija i poboljšala produktivnost programera.
Vodeći princip ovog predloga od strane kompanija: ARM, Intel i Nvidia je da se koriste postojeći sporazumi, koncepti i algoritmi izgrađeni na IEEE standardizaciji. Ovo omogućava najveću slobodu za buduće inovacije na polju razvoja veštačke inteligencije, istovremeno pridržavajući se trenutnih industrijskih standarda.
Intel postavio standarde za brži razvoj veštačke inteligencije
Intel predložio, ostali usvojili. Najnovija specifikacija balansira između postojećeg hardvera i softvera kako bi se olakšala i ubrzala implementacija od strane programera…