AMD Bulldozer

AMD Bulldozer

Pre nekoliko dana je konačno i zvanično predstavljena nova generacija AMD procesora, pod prostim nazivom „AMD FX“. Ovaj naziv je korišćen još ranije u nekim prethodnim modelima procesora, pa i nije neko iznenađenje zbog čega je upotrebljen baš taj naziv. Iza FX oznake nalazi se dugo i predugo očekivana Bulldozer arhitektura, od koje se očekivalo da AMD procesore vrati u igru i kada su u pitanju čiste performanse. Tih performansi, makar u izvornom smislu, još od Athlon 64 vremena nije bilo, pa je AMD bi prinuđen da se…

    Sadržaj

      Miloš Stamenković Istovremeno, upravo je u tome i ležao ključ za AMD u proteklom periodu, jer su na raspolaganju bili uglavnom procesori u rasponu od low-end do mid-range segmenta tržišta, odnosno pokrivali su samo nižu i srednju klasu. Bulldozer arhitektura treba da predstavlja rešenje ovog problema, omogućavajući procesorima baziranim na njoj da dostignu performanse koje imaju trenutno aktuelni konkurentski modeli. Uspešan razvoj ovog plana najviše je kočila činjenica da je sam razvoj novog jezgra trajao veoma dugo, uz nekoliko velikih odlaganja. Ovo vodi ka mogućnosti, da ne kažemo opasnosti, da samo jezgro jednostavno zastari u procesu razvoja, što automatski utiče na konkurentnost u momentu kada se finalni proizvod pojavi pred potencijalnim kupcima. Osnovni tehnički detalji arhitekture su bili dostupni već izvesno vreme, pa smo mogli videti da Bulldozer jezgro predstavlja dosta veliku promenu u odnosu na prethodna AMD rešenja. Ono što nismo mogli do sada videti jesu čiste brojke, odnosno kako se svi ti noviteti koje ima Bulldozer jezgro preslikavaju na performanse u praksi.
       

       
      Bulldozer koncept Osnovna ideja na kojoj se bazira Bulldozer arhitektura je modularnost, pa je tako osnova ove arhitekture u stvari „dual core“ jezgro. Ovaj pristup omogućava AMD-u veoma laku manipulaciju po pitanju kreiranja varijanti procesora sa više jezgara, pa je tako samo pitanje koliko će određeni model procesora imati Bulldozer modula. Dva jezgra u Bulldozer modulu su veoma tesno povezana, poseduju poseban L1 keš, ali i daljeni L2 keš. U stvari, L1 keš je poseban za „Int“ deo jezgra, dok „FP“ deo modula (postoji samo jedna FP jedinica u modulu) može da koristi oba L1 keša, kao i deljeni L2 keš.
       

      Svaka od dve „Int“ jedinice ima četiri „pipeline-a“, što je pojedinačno manje od Phenom II jezgra, ali pošto u jednom Bulldozer modulu ima dve „Int“ jedinice, ukupno je na raspolaganju osam pipeline-ova. Tako je jedan Bulldozer modul veći od jednog klasičnog jezgra, ali je manji od klasične varijante kada se skroz dupliraju dva jezgra. U operativnom sistemu, jedan Bulldozer modul se prijavljuje kao dva jezgra, baš kao što je to slučaj kod Intel procesora sa HyperThreading-om.
       

       
      Međutim, ako Bulldozer poseduje dve stvarno odvojene „Integer“ jedinice, a deli se samo FPU deo, onda se može reći da ovo rešenje omogućava mnogo bolje multihread performanse. Dakle, Bulldozer procesor sa četiri modula će se u operativnom sistemu prikazati kao CPU sa osam jezgara. Što se tiče kapaciteta keš memorije koja je na raspolaganju, svako jezgro (dva po modulu) poseduje po 16 KB L1 keša za podatke i 32 KB L1 za instrukcije. FPU jedinica u svakom modelu može da povlači podatke iz bilo kog L1 keša, u zavisnosti od trenutne potrebe. Interesantno da je kapacitet L1 keša nešto manji neko kod prethodnih procesora, ali AMD tvrdi je kapacitet L1 keša dovoljan, i da veliki deljeni L2 keš efikasno nadoknađuje nešto manji L1 kapacitet.
       

       
      Tako je ukupna veličina L2 keša celih 8 MB za ceo procesor, odnosno 2 MB L2 keša po jednom Bulldozer modulu. Na raspolaganju je i L3 keš ukupne veličine 8 MB, što opet znači 2 MB L3 keša po jednom modulu. Naravno, direktno u jezgru je integrisani i „northbridge“ koji obezbeđuje dva 72-bitna DDR3 memorijska kanala, kao četiri 16-bitna HyperTransport linka. Pored promena u konceptu koje donosi Bulldozer, AMD je morao izvrši i određena unapređenja u samoj arhitekturi osnovnog jezgra. Tako je Bulldozer  poseduje duži „pipeline“ u odnosu na Phenom II, čime je obezbeđena mogućnost da Bulldozer procesori ostvaruju veći radni takt. Logično, sa dužim „pipeline-om“ značaj „branch prediction“ jedinice postaje mnogo veći. Jednostavno, ukoliko dođe do greške u predviđanju, dolazi do značajnog gubitka performansi jer se ceo sadržaj „pipeline-a“ mora puniti ispočetka. Zato Bulldozer poseduje značajno unapređenu „branch prediction“ jedinicu , koja omogućava mnogo bolje predviđanje grananja instrukcija, a samim tim osigurava i bolje performanse.
       

       
      Sama „branch predicton“ jedinca zavisi od „prefetch“ sistema koji povlači podatke, a Bulldozer poseduje nezavisne „prefetch“ jedinice i na L1 i na L2 keš nivou, čime se teoretski opet omogućavaju bolje performanse, i manji negativni uticaj na performanse ukoliko dođe do lošeg predviđanja grananja. Pored ovih modifikacija, Bulldozer poseduje i podršku za nove setove instrukcija. Tako su pored SSE 4.1 i 4.2 instrukcija, na raspolaganju je još novi AVX i XOP set instrukcija. AVX i AES setovi su tu za ubrzanje raznih enkripcija podataka, dok XOP set treba da obezbedi dodatne performanse u kompleksnim matematičkim kalkulacijama. Kao i uvek, direktna primena ovih setova instrukcija zavisi od adekvatne softverske podrške, pa će biti potreba određen period do momenata kada će dotične instrukcije biti implementirane u većini popularnih aplikacija. AMD FX Startna ponuda sa kojom AMD kreće u ponudi FX procesora se sastoji od tri modela. FX-8150 u momentu lansiranja predstavljati najjači Bulldozer procesor, a osnovni radni takt je 3.6 GHz. Naravno, kako i ovde postoji „Turbo“ tehnologija, FX-8150 u „Turbo Core“ modu radi na 3.9 GHz, dok je maksimalni Turbo takt 4.2 GHz. Sama modularna konfiguracija omogućava veoma lako isključivanje delova procesora (po dva jezgra, odnosno po jedan modul) čime se može ostvariti ušteda u potrošnji energije kada je procesor u „idle“ modu. Sa druge strane, ovo se može iskoristiti za povećanje radnog takta drugih modula, što je upravo sistem koji AMD koristi za Turbo mod.
       

       
      Pored FX-8150 kao najjačeg modela, na raspolaganju su još dva modela sa osam jezgara i  jedan sa šest jezgara. U stvari, samo reklamiranje da je FX-8150 prvi procesor sa osam jezgara se može dvojako posmatrati, u zavisnosti od toga kako gledate na modularnu Bulldozer arhitekturu. Jednostavno, dve ALU i jedna FPU jedinica nisu dva kompletna jezgra, pa se zato ovo može okarakterisati kao procesor sa osam ALU jedinica. Isto važi i za ostale modele, pa će FX-6100 imati tri Bulldozer modula, a FX-4170 će imati dva modula.
       

       
      Kada je u pitanju cena, AMD opet nastupa veoma agresivno. Tako je cena za FX-8150 samo 245 dolara, što je u našoj vrednosnoj valuti ispod 200 evra. Ovo definitivno deluje kao veoma primamljiva cena, a koliko je stvarno tako se najbolje može videti kroz performanse.  Pored toga, svi AMD FX procesori će biti sa potpuno otključanim množiocem, što logično ostavlja maksimalne overkloking mogućnosti za sve korisnike. Konačno, performanse U svojoj prezentaciji, AMD poredi FX-8150 procesor sa Core i7 i Core i5 modelima, što znači da se od Bulldozer procesora očekuje da bude konkurent ovih aktuelnim Intel procesorima. Naravno, i svi korisnici očekuju takav nivo performansi, pa sa upravo takvim očekivanjem kreće u analizu rezultata testova. Ukoliko uporedimo FX-8150 sa ostalim konkurentskim procesorima, na prvi pogled sve izgleda veoma dobro. Prosto sintetički testovi ukazuju na promene u odnosu na Phenom II, kao i na posedovanje novih setova instrukcija, što logično rezultuje dobrim ciframa koje se dobijaju. Tako je ovde FX-8150 očekivano sporiji od Core i7 2600K, ali i brži od Lynnfield Core i7 870, što je tačno i mesto na kojem smo očekivali da se i nalazi novi AMD procesor.
       

       
      Ono što na nominalnim radnim taktovima „vadi“ situaciju kod FX-8150 procesora je čista prednost u megahercima, jer je Bulldozer jezgru i neophodan veći radni takt kao bi ostvario adekvatne performanse. Ukoliko pokrenemo neki laganiji „single thread“test, jasno se može videti da Bulldozer teško uspeva da održi korak sa starim Phenom II X4 980 i Phenom II X6 modelima, što nikako nije povoljna situacija za novi procesora. Ovo dolazi kao direktna posledica želje da se lakše stigne do što većeg radnog takta, za šta je primarno zadužen duži „pipeline“ koji gotovo uvek ima negativne posledice po IPC (broj instrukcija po jednom kloku).
       

       
      Jednostavno, što manji IPC to je i ukupna efikasnost procesora manja, pa je i neophodan veći radni takt kako bi se ostvarile adekvatne performanse. AMD se maksimalno trudio da izbegne ovo kroz modifikacije u arhitekturi, i da IPC ostane na Phenom II nivou, ali se ipak u tome nije uspelo. Iako se svi trudimo da maksimalno testiramo sve procesore kroz „multi thread“ scenarije, jasno je da su još uvek „single thread“ performanse najčešće koriste kod prosečnih korisnika. U redu, uvek se može reći da prosečan korisnik u startu i nije zainteresovan za nove „quad“ ili više jezgarne procesore, ali su i pored toga „single thread“ performanse bitne. Pored toga, „latency“ na L2 i L3 keš memoriji je nešto veći, pa je i ovo jedan od razloga zbog kojeg se FX-8150 muči da na istom radnom taktu održi korak i sa starim Phenom II procesorima.
       

       
      Duži „pipeline“ i veća količina same keš memorije su glavni uzroci za dotični nivo performansi. Kao jedno od rešenja manjeg IPC-a i većeg kašnjenja keša, AMD upotrebio je „Turbo“ mod koji već izvesno vreme predstavlja obaveznu funkciju svakog procesora. Jednostavno, u određenim situacijama kada se detektuje „single thread“ primena, procesor će sam ugasiti jedno ili više jezgara, dok će preostala aktivna ubrzati i tako će se ostvariti rast performansi. U ovoj situaciji, FX-8150 će podići radni takt jezgra na 4.2 GHz, ostvarujući u proseku oko 5 procenata veće „single thread“ performanse. Sa „Turbo“ modom, FX-8150 popravlja situaciju u odnosu na Phenom II jezgro, ali je definitivno jasno da su „single thread“ scenariji najslabija tačka novog Bulldozer jezgra. Kada se pokrene neka „multi thread“ aplikacija, Bulldozer tu dolazi na svoj teren na kome nudi daleko bolje performanse. U ovim situacijama, dakle uglavnom striktna rendering i enkoding primena, FX-8150 uspeva da održi korak čak i sa Core i7 2600K, naravno uz očiglednu prednost u većem radnom taktu, za šta se može reći da je sasvim zadovoljavajući rezultat.
       

       
      Ono što ipak malo kvari utisak je činjenica da FX-8150 u ovim aplikacijama uspeva da bude tek nešto malo brži od Phenom II X6 procesora, koji teoretski ima dva jezgra manje. Zbog arhitekture koja podrazumeva jednu deljenu FPU jedinicu po modulu (dve ALU jedinice), Bulldozer mora da koristi AVX i ostale dodatne setove instrukcija kao bi ostvario veću FPU efikasnost i omogućio da performanse budu na nivou Phenom II X6, iako u realnosti ovaj stari procesor ima dva FPU-a više. Ovde se dobro može videti i neophodnost adekvatne softverske podrške novim setovima instrukcija koje Bulldozer poseduje, jer samo sa njima ovaj procesor može pokazati svoju punu snagu. Ovo je posebno značajno za sve „kripto“ aplikacije, kao i enkoding primene. Upravo zahvaljujući ovim novim instrukcijama (SSE 4.1 i 4.2, novi AVX i XOP set instrukcija, AVX i AES setovi i XOP), naravno kada su iskorišćenje od strane softvera i omogućavaju FX-8150 procesora da održava korak sa jačim konkurentskim modelima. Jedno od poređenja koje može biti interesantno je direktno suprostavljanje na istom radnom taktu FX-8150 i starog Core i7 870 procesora baziranih na Lynnfield jezgru. Iako bi neki mogli reći da nije adekvatno porediti staru generaciju procesora sa novom, realnost je takva da je upravo Lynnfield nekako najbolja meta za poređenje sa Bulldozerom. Ovde se veoma jasno može videti koliko je AMD uspeo da dostigne Intel po pitanje arhitekture i efikasnosti procesora. Jednostavno, četiri jezgra plus Hyper Threading kod Intel, odnosno osam “polujezgara” i četiri FPU jedinice kod AMD-a (što bi se možda moglo nazvati nekom vrstom „hardverskog“ hyper threading-a).
       

       
      Dakle, kada FX-8150 na 3.6 (sa aktivnim Turbo modom) uporedimo sa Lynnfield-om na 3.6 GHz (bez dodatnog Turbo moda), jasno se može videti da je staro Lynnfield jezgro i dalje brže u većini bitnih test scenarija. Bazična sintetika očekivano daje prednost Bulldozer jezgru, ali kada se krene sa realnim testovima koji simuliraju prave aplikacije, jasno je da Bulldozer teško može da se nosi u „klok za klok“ poređenju sa Lynnfield baziranim procesorima.
       

       
      Jednostavan pogled na rezultate jasno govori više od hiljadu reči. Istina, dosta vremena smo posvetili tesiranju FX-8150 procesora kroz razne 3D i video editing softverske pakete pokušavajući da nađemo scenario u kojem će Bulldozer raditi što je moguće bolje, ali su jednostavno performanse ostale u istom odnosu. Ono što pokazuju Maya i FryBench se preslikava u istom odnosu na ostale aplikacije koje su dosta „multi-thread“ aktvine. Pogledajte rezultate na narednim stranama…  

       

       
      Velika je doza očekivanja bila pred dolazak Bulldozer procesora. Većina ljubitelja računara i entuzijasti su se nadali će se AMD sa Bulldozer modelima vratiti na staze stare slave. Međutim, to je bilo veoma teško ostvariti, pa se pogledom na rezultate koje Bulldozer pruža može stvoriti i osećaj blagog razočarenja. Svima nam je potreban jak AMD, jer bez dovoljno jake konkurencije Intel ostaje slobodan da radi „šta hoće“, što se jasno može videti na Sandy Bridge generaciji procesora. Primera radi, nema više starog dobrog overkloknga, već je to moguće sam na najskupljim modelima. Upravo ovo je jasan pokazatelj koliko Intel ima slobodnog prostora, i zbog čega je korisnicima neophodan AMD sa jakim procesorima koji će pružiti dobru alternativu. Bulldozer definitivno predstavlja zanimljivu arhitekturu, u kojoj je teoretski moguće da se jedan modul ponaša i kao tri jezgra (uz specijalno pisan i žestoko optimizovan softver), ali u ovom momentu se vidi da će borba se konkurencijom biti dosta teška.

       
      Problem manje IPC efikasnosti je realno najveći, što jasno priznaje i sam AMD kada se pogleda veoma agresivan plan ove kompanije za sledeće dve godine. Tako se već za sledeću godinu najavljuje nova varijanta Bulldozer jezgra koje će podići IPC performanse za oko 15 procenata, a za 2013. godinu sledi i novi „update“ koji treba opet da obezbedi IPC skok u navedenom procentu. Očigledno AMD ima ideju i želju da dodatno unapredi arhitekturu i principe predstavljene sa Bulldozer-om, ali je realno da će „vožnja sa bagerom“ u prvo vreme biti malo neudobnija za AMD. Zbog toga je AMD morao od starta da krene sa agresivnom politikom cene, pa će tako FX-8150 kao trenutno najbrži predstavnik Bulldozer generacije procesora koštati manje od 200 evra. Ipak, izgleda će cena morati još agresivnije da ide na dole, jer trenutno se Core i7 2500K može naći za oko 180 evra. Iako FX-8150 na nominalnom taktu u nekim situacijama i može da se nosi sa Core i7 2500K, ovaj Intel procesor je ipak znatno moćniji u odnosu na Bulldozer. Ako ovde ubacimo i overkloking deo priče, prednost Core i7 2500K je još veća.
       

       
      Maksimalni dometi „na vazduhu“ za FX-8150 su trenutno 4.5 GHz, dok Core i7 2500K ostvaruje 4.8 GHz. Sama prednost u radnom taktu će na kraju doneti i još veću razliku u performansama u korist Intel procesora, i to je jednostavno tako. Opet, iako FX-8150 u nekim situacijama može da bude dovoljno konkurentan, biće teško ubediti korisnika da investira isti novac u ipak sporije rešenje. Upravo ubeđivanje korisnika da pređu na Bulldozer procesor u ovom momentu deluje problematično, pa će AMD sigurno morati veoma brzo da uradi dodatnu korekciju cena. Ono na šta AMD računa je cena kompletne platforme, gde matične ploče treba da budu nešto jeftinije, pa će tu možda biti prostora za dodatne finansijske kalkulacije. Ipak, oni korisnici koji imaju neki Phenom II X6 trenutno nemaju razloga da prelaze na Bulldozer, pa mogu mirno sačekati sledeću verziju koja bi takođe trebalo da bude AM3+ kompatibilna, zbog čega takođe treba pohvaliti AMD. Vlasnici Phenom II X4 procesora mogu razmišljati u Bulldozer pravcu, ali verovatno bi veći broj mogao sačekati da cena FX-8150 i ostalih modela delimično padne. Ipak su korisnici AMD procesora tradicionalno orijentisani prema kreiranju platforme koja nudi maksimalan odnos isplativosti, pa će sigurno razmišljati u ovom pravcu.
       

       
      Na kraju, ono što se može pozitivno okarakterisati je svakako veoma agresivan plan koji ima AMD za naredne dve godine. U ovom periodu se očekuje da se naprave korekcije na Bulldozer jezgru koje će se fokusirati na slabije strane (IPC), dok će manji fokus biti ka „multi-thread-u“ jer je to i sada najjača karakteristika Bulldozer jezgra. Videćemo šta će doneti Piledriver i da li će njegove modifikacije biti dovoljne da se AMD dodatno približi ponudi svog ljutog konkurenta. Sa Bulldozer jezgrom je definitivno napravljen veliki korak napred, ali je problem što je zaostatak već bio preveliki, pa taj veliki korak jednostavno nije bio dovoljan da ozbiljnije uzdrma tržišne odnose. Nadamo da će AMD uspeti u realizaciji svojih planova, i da će sledeći korak biti još značajniji pomak napred.  

      Ostani u toku

      Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

      Hvala!

      Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

      Možda vam se svidi