Dušan Kovačević
Ovakav pristup svakako jeste budućnost, ali bi na trenutno aktuelnom nivou tehnologije proizvodnje čipova ovako kompleksan dizajn verovatno naišao na brojne probleme. Stoga su u AMD-u odlučili da se prve generacije Fusion procesora „takmiče“ u nižim tržišnim kategorijama, a za najvišu, i posebno za serversko tržište, rađeno je na novoj arhitekturi pod imenom Bulldozer. U narednih par dana pokušaćemo da vam predstavimo ove dve arhitekture, ukažemo na neka od rešenja kojima su inženjeri pribegli, ali i pokušamo da zavirimo u budućnost i procenimo šta ona donosi kompaniji AMD.
Bulldozer – nova nada za AMD u najvišoj klasi
Još od pojave Conroe arhitekture i prvih procesora iz Core 2 Duo serije pre gotovo četiri godine AMD kaska za najvećim konkurentom, kompanijom Intel, kada su performanse u pitanju. Nova arhitektura, serverski čip Barcelona i desktop varijanta Agena, u većini situacija nisu bili u stanju da se nose sa odgovarajućim konkurentima, i pored na papiru znatno naprednijeg dizajna. Veoma niski radni taktovi i relativno visoka potrošnja, posledice 65nm tehnologije proizvodnje, uz očigledan zaostatak u single-thread performansama, kao i TLB greška, doveli su do niza ne baš dobrih recenzija, koje su uz nesporan kvalitet konkurentskih proizvoda i prednost u proizvodnom procesu koje Intel poseduje, doveli do naglog i značajnog pada popularnosti kada su AMD-ovi procesori u pitanju. Prva revizija, izrađena u 45nm proizvodnom procesu, umnogome je poboljšala situaciju, ali to nije bilo dovoljno da se sustigne Intel, koji je u međuvremenu značajno unapredio dizajn – integracija višekanalnog memorijskog kontrolera i mnogih drugih rešenja koja je baš AMD prvi doneo na tržište, doneli su procesorima zasnovanim na Nehalem arhitekturi i njenim derivatima očiglednu prednost koja traje i danas.
Budućnost je Fuzija, ali da li je Fuzija budućnost?
AMD-ov odgovor je bio jedini mogući – za tržišni udeo borili su se nižom cenom i dobrim odnosom cene i performansi. Kolika je prednost kompanije Intel kada su sirove performanse u najvišoj klasi nije teško utvrditi jednostavnim uvidom u cenovnike – trenutno najskuplji procesor kompanije AMD namenjen desktop tržištu, šestojezgarni Phenom II X6 1090T, košta skoro četiri puta manje u odnosu na Intelov model sa istim brojem jezgara. Ovakav način poslovanja doveo je do toga da AMD relativno uspešno održi tržišni udeo na nivou od nešto ispod 20%, što nije malo, ali je svakako manje nego što bi u ovoj kompaniji voleli, i sve to po cenu nižih prihoda i profita kompanije. Jedini način da se Intel „pretekne“ je uvođenjem novih proizvoda, zasnovanih na inovativnom dizajnu. Takvi su bili K7, K8, a takav je bio i K10.5, ali je tržišni uspeh ovih proizvoda na kraju bio bitno različit. Sledeća takva arhitektura će biti Bulldozer, koji će se prema trenutno dostupnim informacijama pojaviti tokom 2011. godine. Preciznije informacije za sada nisu dostupne, ali pretpostavljamo da će ovo realno značiti drugi kvartal naredne godine za serverske, i treći za desktop čipove visoke klase.
Modularnost je budućnost
Svakako osnovni cilj nove mikroarhitekture na kojoj AMD radi već duže vreme je postizanje velike modularnosti čipa, kako bi se prostim dodavanjem osnovnih jedinica na jednostavan način povećavala i snaga centralnog procesora. Osnovna jedinica nove arhitekture je Bulldozer modul, koji se sastoji od dva Integer jezgra i jedne deljene Floating Point jedinice. U odnosu na tradicionalni pristup, ali i na SMT rešenje koje koristi Intel (HyperThreading), ovakav dizajn u teoriji donosi „najbolje od oba sveta“ – bolje performanse u multithreaded optimizovanim aplikacijama, ali i istovremene uštede na poljima potrošnje i površine čipa. Dodavanje drugog Integer jezgra povećava površinu modula za 12%, ili još manjih 5% ukoliko se računa površina celokupnog čipa, sa fiksnim zajedničkim jedinicama koje će svi moduli deliti među sobom. Ukratko rečeno, dosadašnjim pristupom je za dodavanje svakog pojedinačnog jezgra bilo neophodno „uduplati“ i mnoge druge jedinice, koje u velikom broju slučajeva nisu bivale iskorišćene u realnim aplikacijama, ali su povećavale i površinu i potrošnju. Ovakvim dizajnom Bulldozer modula AMD pokušava da pronađe kompromisno rešenje, koje bi trebalo da pomiri ova dva naizgled nepomirljiva sveta – dodavanje drugog jezgra neće i udvostručiti performanse, iako će dobitak biti veći nego u slučaju primene neke tehnologije poput HyperThreadinga, ali će gubici (penali) u slučaju korišćenja nedovoljno optimizovanog softvera biti daleko manji nego do sada.
Dobrodošli u Bulldozer jezgro
Naravno, ovakvo rešenje nije jedina izmena u odnosu na aktuelne arhitekture ove kompanije – značajne izmene će doživeti i drugi delovi čipa, a nekima od njih će ova generacija biti i prva značajna revizija jos od vremena K7 procesora. Prva takva jedinica je ona za dekodiranje, koja je sada sastavljena iz četiri dela, što je unapređenje u odnosu na sve AMD-ove arhitekture nakon K7, kod kojih je bila 3-wide, uključujući i Phenom II. Svaki modul, kao što smo već rekli, poseduje jednu FP jedinicu, koja je takođe doživela unapređenje u odnosu na Phenom procesore – svaki modul sada poseduje dve 128-bitne FMAC (Fused-Multiply-ACcumulate) grane, dok u aktuelnoj postoji jedna. Šta više, ove dve 128-bitne jedinice mogu postati i jedna 256-bitna ukoliko se za time ukaže potreba, što ukazuje na fleksibilnost dizajna novog Bulldozer modula.
Pravi, ili kako u kompaniji vole da kažu, “jaki” tredovi i Hyperthreading
Još jedna stvar koja je morala doživeti značajne izmene je i predviđanje grananja (Branch Prediction), budući da je sa ciljem postizanja što većih radnih frekvencija produžen ceo pipeline. U slučaju Phenom generacije procesora, kada dođe do greške, penali u performansama su bili značajni, ali je u Bulldozer modul implementirano daleko efikasnije rešenje koje na papiru omogućava daleko veću efikasnost. Još jedna stvar koja je donekle izmenjena u odnosu na prethodne generacije je količina L1 keš memorije. Dok je do sada AMD obično sa svakom većom revizijom povećavao količinu ove memorije, sa Bulldozerom ide „korak unazad“, i svako Integer jezgro poseduje sopstvenih 16KB keš memorije za podatke. Naravno, i dalje postoji 64KB keš memorije istog stepena za instrukcije. L2 keš memorija će biti deljena za sve jedinice na nivou modula, dok će više modula u samom čipu deliti veliku količinu L3 keša. AMD za sada nije zvanično potvrdio količine ovih memorija, ali se pretpostavlja da će L2 biti 1MB, a L3 najmanje 8, možda i svih 16MB.
Jezgra sa svojim zasebnim komponentama i komponentama koje dele
Sem L3 keša, svi moduli će deliti i memorijski kontroler i NorthBridge, koji su u AMD procesore integrisani već duže vreme. Očekujemo da i memorijski kontroler doživi značajno unapređenje, i iako se AMD još uvek nije zvanično oglasio po ovom pitanju, nikako ne bismo isključili mogućnost da vidimo i četiri kanala u čipovima najviše klase. Izvesno je da će konačno (i zvanično) biti implementirana podrška za memorijske module DDR3 velikih brzina. Posebna unapređenja postignuta su na nivou uštede energije, budući da će novi čipovi biti u mogućnosti da po potrebi „gase“ sve nepotrebne module. Zauzvrat, biće implementirana tehnolgija slična onoj koju je Intel predstavio sa Nehalem arhitekturom, koja omogućava podizanje radne frekvencije aktivnih modula radi postizanja što boljih performansi u single-threaded aplikacijama. Već Thuban jezgro je doneo jedan vid Turbo režima rada AMD procesorima, ali će ovo rešenje u Bulldozer-u biti daleko efikasnije.
Svetla budućnost ili poslednji trzaji?
Svi procesori zasnovani na Bulldozer arhitekturi biće izrađivani u 32nm HKMG SOI procesu u kompaniji Global Foundries, u kojoj je AMD manjinski vlasnik. Plan kompanije je veoma jasan, i direktna posledica već objašnjene modularnosti – što viša klasa, to veći broj pojedinačnih modula. Tako se očekuje da prve verzije serverskih procesora kodnog imena Interlagos poseduju 6 ili 8 modula, odnosno 12 ili 16 jezgara, dok je gotovo izvesno da će desktop procesori kodnog imena Zambezi startovati sa četiri modula, odnosno 8 jezgara.
Prema najavama iz same kompanije, performanse u dobro optimizovanim, multi-threaded aplikacijama trebale bi da premaše 80% onoga što bi doneo CPU tradicionalnog dizajna (na račun nekih deljenih jedinica). Ukoliko ste se u ovom trenutku zapitali gde je tu onda napredak, objašnjenje je veoma jednostavno – te performanse će biti postignute uz značajnu uštedu prostora i daleko manju potrošnju.
Strahoviti stepen integracije
Procenjuje se da bi Bulldozer arhitektura mogla da ponudi performanse slične Phenom generaciji procesora uz praktično dvostruko manju potrošnju, a na račun toga bi se u procesor sa istim deklarisanim TDP-om moglo smestiti daleko više modula, što direktno donosi bolje performanse. Serverske verzije procesora će svakako koristiti nedavno predstavljeno podnožje G34 (koje će AMD nastaviti da koristi i u narednim godinama), dok je za Zambezi namenjen AM3r2. Ovaj socket će posedovati 938 pinova (dva manje u odnosu na AM3), pa se postavlja pitanje da li će on biti kompatibilan sa aktuelnim AM3 pločama. Na žalost, na ovo pitanje vam trenutno ne možemo dati definitivan odgovor, iako postoje indicije da će se AMD odlučiti za sličnu stvar kao sa Phenom II generacijom, budući da ti procesori rade i na AM2+, ali i na nekim AM2 matičnim pločama.
Bulldozer, namenjen tržištu visokih performansi, ali i serverskih aplikacija zahvaljujući visokom stepenu skalabilnosti
Sa Bulldozerom AMD pokušava da uradi nešto što nije uradio u prethodnih deset godina – predstavljanje potpuno novog dizajna urađenog od nule, koji sa prethodnim generacijama procesora nema mnogo dodirnih tačaka. To jeste veliki rizik, ali smo već rekli i da je neophodno ukoliko žele da se takmiče sa ogromnom kompanijom kakva je Intel. Naravno, glavni cilj ovih procesora će biti povratak u više tržišne segmente i uvećanje udela na serverskom tržištu, što će sem prestiža kompaniji omogućiti i podizanje prosečne cene svakog prodatog procesora i sledstvenu veću zaradu. Naravno, da li će to uspeti umnogome zavisi i od toga šta će nam početkom naredne godine doneti novi procesori zasnovani na Sandy Bridge arhitekturi kompanije Intel. Za prognoze je još rano, ali nije isključeno da posle gotovo pet godina krajem 2011. godine konačno vidimo pravu i ravnopravnu tržišnu utakmicu dva vodeća proizvođača centralnih procesora.