Branko Maksimović
AMD Radeon HD4870X2
Uvod
U poslednjih nekoliko meseci, kompanija AMD je verovatno najviše ponosna na svoju grafičku diviziju, nekada posebnu kanadsku kompaniju ATI Technologies. Od trenutka kada su konkurentu prvi put zadali muke sa RV670 čipom, pa do danas, kada su opet neprikosnoveni tehnološki i brzinski lideri, prošlo je tek devet meseci, iako se mnogima od nas čini da je prohujalo više od godinu dana. Radeon HD3800 familija je i na tržištu obeležila preokret u poslovanju kompanije ATI, koji se interno desio nešto ranije. Iako nije doneo više performanse, RV670 je u nekom drugom smislu ojačao ponudu kompanije AMD. Pre svega, kroz model HD3850 je ponudio fantastičan nivo performansi u cenovnom segmentu od ispod 200 dolara, a ta cena se relativno brzo spustila i u segment od 140 dolara. Zatim, pomoću ovog čipa, AMD je usavršio 55-nm proizvodni proces. I na kraju, ali ne i najmanje bitno je i to da je ovo bio prvi high-performance AMD čip koji ima integrisan Unified Video Decoder engine. Svakako, podrška za DirectX 10.1 je nešto na šta su u AMD-u najviše ponosni, jer je tako njihov GPU tehnički napredniji od onog iz konkurencije. DirectX 10.1 donosi dosta konkretnih novina i zvaničan je update ovog API-ja, koji je i Microsoft u startu podržao kroz prvu servisnu zakrpu Windows Vista OS-a. Ovaj GPU je omogućio AMD-u da ostvari i brzinsku nadmoć, bez obzira na to što im je za dostizanje nivoa koji je nudio GeForce 8800 Ultra bilo potrebno više od 18 meseci. Radeon HD3870X2 je sedeo na tronu svega nekoliko meseci, da bi ga odatle oteralo još manje elegantno dual-GPU rešenje ljutog konkurenta, koji jednostavno, po svaku cenu, mora da bude prvi.
Još uspešniji od svog prethodnika, RV770, krivac uspeha koji su postigle Radeon HD4850 i HD4870 kartice, proglašen je najboljim grafičkim čipom koji je ATI ikad napravio. Ove kartice se, čak i u vreloj letnjoj sezoni, koju IT uvoznici i distributeri mrze iz dna duše, prodaju kao kokice ispred bioskopa Stem Cinema. RV770-puta-dva, ono što AMD interno zove R700, a što se reklamira i prodaje kao Radeon HD4870X2, tek će da unese pometnju u redovima kompanije NVIDIA. Čitaoci koju su pratili ovo IT tržište poslednjih meseci (ili čitali naših prethodnih nekoliko testova grafičkih kartica) dobro poznaju scenario ove serije. U devetoj sezoni, koju prati milionska publika, sreća je trenutno na strani Radeon familije, koja je pre devet meseci, na kraju osme sezone, uspela da zada žestok udarac Karingtonovima. Priča trenutno prati HD4800 modele koji su se, kako već možemo da zaključimo, pokazali kao još uspešniji od svojih prethodnika. Čak je i Gainward, do nedavno ekskluzivni NVIDIA-in partner, od počeo da pravi Radeon bazirane kartice (za mnoge ovo i nije preveliko iznenađenje, jer iza Gainward brenda stoji Palit, koji uz sebe drži i Palit i XpertVision – odavno poznate i po Radeon akceleratorima). Kao što smo već pisali, ovo tržište grafičkih kartica je verovatno najdinamičnije u IT industriji, a ciklus generacija je mnogo kraći i pravila, na koja se, kako nam se učini u jednom trenutku, naviknemo uopšte ne važe već u narednoj iteraciji. Dobar primer je već opisani slučaj sa GeForce 9600GT karticama, koje su u trenutku pojavljivanja dobijale fantastične kritike, opisivane kao najlogičnije i najbolje rešenje u klasi od 199 dolara tj. 150 evra, jer je njihova 256-bitna magistrala i brzi DDR3 garantovao odlične performanse u klasi, koja je u odnosu na prethodnika čak i spuštena za oko 50 evra (GeForce 8600 GTS je koštao 200 evra kad se pojavio). GeForce 9600GT je bio dostojan konkurent Radeonu 3850, ali kao što je Radeon HD3870 uslovio niže cene za prve G92 kartice (GeForce 8800 GT i GTS), tako je i GeForce 9600GT poslužio kao katalizator za dalji pad cena jeftinih RV670 modela. Međutim, onda se pojavio RV770. Čak i slabiji model baziran na ovom čipu, koji je u trenutku pojavljivanja koštao koliko i već odomaćeni GeForce 9600GT, uspeva da prestigne i za dve klase više pozicionirani GeForce 9800GTX. Lansiranje GTX2x0 serije kartica bukvalno je zasenila fenomenalna HD4800 serija, iako oni ne ne pripadaju istim klasama. NVIDIA je užurbano predstavila GeForce 9800GTX+, a standardni GeForce 9800GTX dobija nerealno nisku cenu, na kojoj kompanija, a ni partneri, nemaju praktično nikakvu zaradu. GeForce 8800 GT i GTS 512 modeli su ovim praktično istisnuti, a GeForce 9600GT se cenovno pozicionira još niže. Fantastični Radeon HD4870, koji na tržište stiže par nedelja nakon HD4850 modela, pokazao se kao znatno brži od svog “manjeg i tanjeg brata” zahvaljujući prebrzoj GDDR5 memoriji, pa se pokazalo da mu i takmičenje sa većom i skupljom GeForce GTX260 karticom – ne predstavlja problem. Podsetićemo da je i GTX260 kartica bazirana na istom GT200 čipu kao i monstrumski GTX280, ali bez obzira na to, NVIDIA nema izbora i obara cenu ovog modela sa 449 na 399 dolara, a zatim i na 349 dolara, dok njeni partneri samoinicijativno spuštaju cenu i na 299 dolara. Po prvi put u istoriji kompanije desilo se da jedan GeForce pojeftini za 50% u roku od samo nekoliko sedmica? Ovo je za NVIDIA-u zabrinjavajuć podatak, pogotovo ako znamo da je model GeForce 8800 GTX praktično držao cenu čitavih 15-16 meseci.
Po prvi put, na našem testu imamo karticu koja poseduje čak 2GB VRAM-a i to ne bilo kakvog. Radeon HD4870X2 stiže sa 2 x 1GB GDDR5 memorije. Takva kartica, prirodno, mora dosta da košta, a s obzirom da je tržišni lider na svakom polju, za nju morate izdvojiti više od 550 dolara, odnosno oko 450 evra na našem tržištu. Polako smo, opet, došli do trenutka kada za najbržu karticu moramo izdvojiti blizu 500 evra, ali takvu situaciju nismo imali još od vladavine GeForce 8800 GTX i Ultra kartica. Namerno ili slučajno, tek, za trenutak smo i zaboravili da je GTX280 imao preporučenu cenu koja je za 100 dolara viša, jer se ove kartice trenutno i na našem tržištu prodaju po cenama od oko 350 evra. Ali, ako dozvolite, mi bi smo, pre ulaženja u detalje, koje i očekujete, napomenuli da se, ovoga puta radi o kartici koja nudi 2.5 TeraFLOPS-a processing moći, kartici koja poseduje 2 GB najnovije i najbrže video memorije, kartici koja, na kraju krajeva, jedina omogućava igranje fenomenalnog Crysis-a u XHD rezolucijama.
Šta donosi R700?
Setićemo se vremena kada je predstavljan R600 i trenutka kada je AMD najavio tadašnji high-end grafički akcelerator koji (ipak) nije bio pozicioniran ka najjačem rešenju konkurentske kompanije NVIDIA. Tada su mnoge priče razmenjivane na forumima bile obojene razočarenjem i nevericom, a neki su čak prognozirali da naslednik R600 čipa neće ni ugledati svetlost dana. Naslednik je, pak, predstavljao preview AMD-ove novu strategije kada je discrete grafika na desktop računarima u pitanju. Najbolje performanse po potrošenom vatu i performanse u određenom cenovnom rangu nisu bile kategorije koje su ljubitelji nekada neprikosnovenog ATI-ja shvatali previše ozbiljno, ali kada je RV670 pokazao da AMD još uvek ume da konkurenciji zada glavobolje, stvari su počele da dolaze na svoje mesto. Nakon toga, čak su i ljubtelji “crvenog tima” dočekali svojih pet minuta, jer je RV670X2 postigao i bolje rezultate nego što su mnogi očekivali. To je sve bio samo početak, a RV770 je učinio da u potpunosti razumemo novu koncepciju i dugoročnu strategiju kompanije AMD. Grafička divizija kompanije je imala problem da ponudi konkretno rešenje u najvišim cenovnim segmentima sve do pojave modela HD3870X2, ali, čak i da se ova kartica nije pojavila, u višim kategorijama ne leži veliki profit, već se kreira imidž brenda. Za razliku od Radeona HD2900, poslednjeg ne-ekonomičnog ATI grafičkog procesora čija je arhitektura možda bila i previše “ispred svog vremena”, RV670, a pogotovo novi RV770 – dizajnirani su sa “balansom” na umu.
Još ranije smo pisali o tome da je potreba za kreiranjem bržeg 3D akceleratora dovela do pojave ne-ekonomičnih, mega-GPU-ova, za koje se novac uložen u R&D obično isplaćuje tek nakon što se kreiraju njegovi mainstream i entry-level derivati. Potreba za većim brojem GigaFLOPS-a i višim fillrate-om, prevazišla je tempo kojim IT industrija osvaja sitniju litografiju. Pre nekoliko godina, kreiran je prvi GPU koji po kompleksnosti i sirovoj snazi prevazilazi centralni procesor. Već sada, NVIDIA GT200 je nekoliko puta veći, kompleksniji i skuplji negoli najkoplikovaniji desktop CPU – Intel Penryn. Čak je i eknonomični RV770, koji se smatra dobro izbalansiranim grafičkim čipom, dovoljno jeftinim i za kartice koje će se prodavati po ceni od svega stotinak evra, solidno kompleksniji od novog Core 2 Duo procesora.
Radeon HD4870X2 je, naravno, kreiran da ponudi najviše – najzahtevnijim korisnicima: zagriženim igračima i ljubiteljima kvalitetne real-time grafike. AMD ga predstavlja kao najbrži grafički akcelerator na tržištu, prvi sa dva gigabajta frame buffer-a, prvi akcelerator sa 512-bitnom magistralom i DDR5 memorijom (efikasno kao 1024-bitna magistrala i DDR3 memorija na istom radnom taktu!!!). Naravno, samo ono prvo je u potpunosti tačno, mada ni druge tvrdnje nisu netačne ako se samo malo drugačije interpretiraju. Tj. ako se saberu. Jer, Radeon HD4870X2 ima dve 256-bitne magistrale i dva puta po 1024 MB memorije koju svaki od GPU-ova koristi za sebe (podaci se ponavljaju i ta memorija se ne deli).
Naša priča iz prvog teksta o RV770 GPU-u se nastavlja. AMD ulazi u drugu fazu svog plana: nakon što su kreirali moćan i ne preterano glomazan GPU namenjen performance-mainstream tržištu, kreiraće i dual-GPU izdanje. Primetićemo da je Radeon HD4870X2 izašao dosta brzo nakon HD4850 i HD4870 modela – nepuna dva meseca kasnije. Na Radeon HD3870X2 smo čekali nešto duže, što znači da je AMD poboljšao svoj time-to-market, ali i da je RV770 fantastično osmišljen od samog starta, pa sa njim nije bilo nikakvih problema. Treća faza podrazumeva kreiranje derivata RV770 čipa. AMD će verovatno ponuditi dva – jedan sa sličnim brojem shader jedinica RV670 GPU-u, ali sa 128-bitnom magistralom, kao i dosta slabiji entry level GPU (64 SP-a i 64-bit bus). Izrađeni u 55-nm procesu, ovi GPU-ovi će moći da se instaliraju na kartice koje će sa DDR3 i DDR2 memorijom koštati oko 90, pa sve do 35 evra. Na slajdu gore možemo videti da se uskoro očekuje i Radeon HD4850X2 koji će koristiti sličan ili isti PCB, ali daleko jeftiniju GDDR3 memoriju (verovatno i u verziji sa 1 GB memorije, iako nije naglašeno).
Radeon HD4870X2 je najbrža i najmodernija kartica koju možete kupiti. Bazirana je na istoj RV770 tehnologiji o kojoj smo već pisali, a koju ćemo ponoviti – uz nekoliko novih detalja. Naravno, tu su i novine, koje slede nakon naše kratke rekapitulacije.
AMD je sasvim sigurno mogao da kreira nekakav ogroman “monolitni” GPU (fiktivni R720), koji bi bio četiri puta veći od RV670 i bar dva i po puta moćniji. No, cena kartice na koju bi on išao bi prevazišla ono što je velik broj kupaca spreman da plati. Yield za takav GPU bi bio loš, a kompaniji AMD u ovom trenutku nikako nisu potrebni gubici; problemi sa napajanjem, zagrevanjem (odnosno hlađenjem) bi svakako postojali, a u ranim fazama razvoja je teško predvideti da li će oni biti rešivi ili „rešivi“. Međutim, čak i da AMD ima daleko više resursa, novi strateški put je uslovio da naredna generacija grafičkog procesora treba da izgleda drugačije. Novi GPU bi, jednostavno, morao da gađa tačno u metu „best buy“ rešenja u više srednje klase. Ultra-efikasan GPU ne mora samo da ima najbolje performanse po ponuđenoj ceni – AMD naglašava da je bitno ostvariti napredak (u odnosu na prethodnu generaciju, a pogotovo u odnosu na konkurenta) i kada su u pitanju kategorije „performanse po utrošenom vatu“ ili „performanse po milimetru površine koji GPU zauzima“. Iako sve zvuči kao da AMD sam sebe tapše po ramenu i teši se što nema najbrži GPU, situacija je danas, nakon što su AMD i NVIDIA otkrili karte, daleko od one u kojoj AMD odlazi sa olimpijade sa utešnom nagradom.
Vreme velikih „monolithic“ GPU-ova (kako ih AMD naziva) je prošlo. Cena za njihov razvoj i sama cena kartice je previše velika i najveći broj igrača i nema ili ne želi da da toliko novca da bi ih posedovali, bez obzira na performanse koje nude. Ove kartice koštaju više od 500 dolara, a vuku preko 250W pod punim opterećenjem. Čak i kada se ponude jeftinije varijante sa delom pipeline-a koji je isključen, kartica proizvođača, ali i čip-dizajnera ne košta mnogo manje; manja je samo zarada, jer se koristi isti ili vrlo sličan PCB i ista, skupa memorija. Ako se, pak, krene sa GPU-om koji košta oko 250 do 300 dolara (na kartici koja predstavlja njegovo najjače izdanje) i troši maksimalno 150W u 3D režimu, dobija se rešenje koje u startu ima odličan odnos cene i performansi, a lako se, uz srazmerno malo dodatnog R&D vremena, specifičnoj ciljnoj grupi mogu ponuditi dual-GPU rešenja koja će nuditi adekvatno više performanse. Naravno, kao što smo i zaključili u našem testu AMD Radeon HD3870X2 kartice svako dual-GPU rešenje ima svojih mana, a one su najviše vezane za činjenicu da je efektivna količina memorije dva puta manja od one koja je fizički prisutna i da performanse često variraju i prilično zavise od drajvera ali i načina na koji je 3D aplikacija napisana. Međutim, AMD ima dosta iskustva kada su CrossFire rešenja u pitanju, a uz novi sistem „vezivanja“ grafičkih čipova, u kompaniji tvrde da će novi high-end „X2 akcelerator“ imati daleko bolje skaliranje performansi od prethodnika.
Šampion srednje-teške kategorije
Ako GPU možemo uporediti sa bokserima, onda je RV770 najsličniji Steve Collinsu, poznatom WBO šampionu najzanimljivije middle-weight kategorije: svestran, lukav i beskrajno zanimljiv GPU koji može da parira i konkurentu iz nešto više klase. AMD je uspeo da konkurentu donekre pokvari lansiranje GeForce GTX2xx serije kartica, jer su “slučajno“ procureli neki rezultati Radeon HD4800 serije kartica. Konkurentu nije bilo nimalo drago da vidi kako kartica koja će koštati oko 250 dolara ume često da bude i primetno brža od modela koji su tvorci GeForce brenda namenili za cenovni rang od 399 dolara. Ubrzo je najavljeno da će model GTX260 dobiti novu, za 50 dolara nižu cenu (iako bi, realno, spuštanje cene za 100 dolara bio logičniji potez), dok je GTX280 ostao u svojoj premium klasi koju će AMD „napasti“ za nekih mesec dana, kako se čini – zbog toga što je red da se i ljubiteljima Radeon kartica bez CrossFir ploča ponudi jedan akcelerator koji nudi izuzetne performanse. Međutim, i Radeon HD4850 je zasmetao NVIDIA-i, pa su, ubrzo, tiho lansirali GeForce 9800 GTX+ (iskreno, čudi nas da ga nisu nazvali GTX240), koji bi trebalo da košta 220 dolara, tj. tek nešto više nego pomenuti konkurent. Problem je, ipak, u tome što je Radeon HD4850, kao što ćemo i sami videti, malo brži od GeForce kartice koja je malo skuplja, pa se, u nešto manjoj meri, ponavlja priča koja važi i na relaciji Radeon HD4870 i GeForce GTX260. Radeon HD4850 je i tema našeg današnjeg testa, a ova kartica ima RV770 GPU koji je „klokovan“ na 625 MHz i 512MB GDDR3 memorije koja radi na nešto manje od 2000 MHz (efektivno) i prodaje se po preporučenoj ceni od 200 dolara (oko 140-150 evra na našem tržištu). Memorija sa GPU-om, pak, komunicira putem 256-bitne magistrale, ali o više detalja vezanih za RV770 ćemo pričati i to odmah.
RV770 GPU
Kao što smo već nagovestili, NVIDIA je u najvišoj klasi odlučila da igra sa tradicionalno velikim monstrum-GPU-om, kakvi su u svoje vreme bili i G80, NV40, NV30… (nećemo dalje). Jasno je da sa čipom od milijardu i četristo miliona tranzistora sa 512-bitnom memorijskom magistralom i gigabajtom memorije ne mogu da računaju da će popuniti cenovne razrede od 200 do 300 evra, pa je kompanija odlučila da još jednom vaskrsne G8… pardon, G92 GPU u vidu optical-shrink verzije ili, možda je primerenije – revizije, koja je nazvana G92b. Pošto znamo da 55-nm postupak služi da se smanji cena proizvodnje, a ne i da se (bitno) povećaju radne učestanosti, znamo i da daleko od nivoa performansi koje dostižu blago overklokovane GeForce 9800 GTX, a samim tim i GeForce 8800 GTS 512 kartice, NVIDIA u ovoj klasi neće ići. A, kako je Radeon HD4850 mnogo bolji nego što se očekivalo, postavlja se pitanje kada će se pojaviti i kako će izgledati prvi derivat GT200 čipa. Mi očekujemo da će neki manji GT2xx čip imati 256-bitnu magistralu, ali veći broj teksturnih i ROP jedinica nego što je imao G92, te da ćemo ponovo doći do čipa koji će u tom (kvantitativnom) smislu podsećati na G80 (ali sa savršenijim TMU jedinicama i boljim threading menadžmentom), ali će biti manji, jeftiniji i radiće na znatno većim učestanostima. Ovaj GPU bi morao da bude manji i jeftiniji od G92b ili bar jednak, ali solidno brži, jer, sa G92b, NVIDIA teško da može da bude dovoljno konkurentna RV770 rešenjima. Iskreni da budemo, za NVIDIA-u se preterano ne brinemo, jer će snaga brenda učiniti da se i nešto manje isplative GeForce kartice jedan solidan period prodaju i bolje nego što zaslužuju. GeForce jednostavno ima jak tržišni zamajac, koji bi adekvatni Radeoni zaustavili samo nakon nekoliko generacija prednosti kakvu sada RV770 ima u odnosu na G92b. Zbog čega ovo pričamo i kakve veze sada ima G92b i “šta može da bude” priča sa predstavljanjem RV770 čipa? Ima svake veze, jer upravo želimo da objasnimo koliko zapravo smatramo da je NVIDIA pogrešila što je dizajnirala naslednika G80 čipa, a ne nečega što bi nastavilo (pravi) put kojim je krenuo G92. AMD može biti konkurentan i GT200 rešenjima. Vrlo brzo će neki Radeon HD4870X2, a verovatno i HD4850X2 biti dovoljno jaki da mu se suprotstave: jači od njih će biti i brži od konkurenta, a jeftiniji će biti „tu negde“, ali će namamiti veliki broj kupaca povoljnom cenom; oprostite nam na spekulaciji, ali naša očekivana projekcija cena za ovakve kartice bi bila – 499 dolara za HD4870X2 i 349 dolara HD4850X2.
Ljubitelji grafike koji su očekivali da naslednik Radeon HD2900XT kartice bude, kao što je to ranije i bio red i običaj, znatno brži od svog prethodnika, bili su razočarani. HD3800 serija je i bila uspešna zato što je ponudila fantastične performanse u cenovnom rangu koji je skoro “za duplo” niži od onog u koji je inicijalno HD2900XT bio lansiran. Dual-GPU rešenje, HD3870X2 je vratio AMD u vrh, bar na kratko vreme, a oni koji su očekivali da i od njega, Radeon HD4800 bude značajno brži, opet su (možda) bili razočarani i oni će opet morati da sačekaju “X2 verziju”. Mislimo, pak, da je sasvim dovoljno da Radeon HD4850 kao kartica iz cenovnog ranga od 150 evra, bude po performansama vrlo bliska (a nekad i jednaka) Radeon HD3870X2 modelu. Više puta smo, tokom predstavljanja novih generacija velikih “monolithic” GPU-ova konstatovali kako se jaz između visoke, srednje i niže klase proširuje i kako najviše razlike u performansama pri predstavljanju nove generacije (u odnosu na staru) viđamo u najvišim segmentima. Tada smo primetili da mainstream klasa napreduje nešto sporije, dok kartice koje koštaju manje od 60 evra, ne napreduju gotovo uopšte (još uvek se koristi DDR2 memorija i 64-bitna memorijska magistrala, ali, ruku na srce, i njima je dodat moćan UVD engine). AMD-u moramo čestitati jer sa novom strategijom koju po drugi put primenjuje sa RV770, najviše unapređuje upravo mainstream segment, koji je i najbitniji za čitavu industriju. Ovakve igračke kartice se i uzimaju kao reper i minimum pri razvoju igara koje će se uskoro pojaviti. Upravo je Radeon HD4850 ta kartica koja je, primera radi, konačno omogućila da se Crysis, na Very High podešavanjima, igra u rezoluciji od 1440 x 900 ili 1680 x 1050 piksela (uz High podešavanja). Pre nego što se pojavila, ovu igru nije bilo moguće igrati na karticama koje koštaju 140 evra. Ni GeForce 9600GT, pre 4-5 meseci, a pogotovo GeForce 8600 GTS, u vreme kada se Crysis pojavio, nisu bili u stanju da igračima sa ovim budžetom omoguće takvo igračko iskustvo. Međutim, šta je sa rezolucijom od 1920 x 1200 i uključenim AA i AF filterima? Kako to da u ovoj rezoluciji ne možemo da igramo Crysis na karticama sa jednim čipom?
Za to su, svakako, potrebna – dva grafička jezgra. Nedavno smo bili svedoci trke koja se vodila kada su sistemski procesori u pitanju. Barijera od dva pa čak i tri gigaherza je probijena pre nego što se neko setio da procesor može imati dva jezgra. Sada je gotovo nezamislivo da neko želi ili misli da je logično da kupi jednojezgarni CPU koji radi na 4 GHz. Daleko je logičnije da sebi nabavi Quad Core koji radi na 2-3 GHz. Pa, i ako je problem da sadašnji softver optimizujemo da dobro iskoristi treće i četvrto jezgro sistemskog procesora, i grafička (igračka) 3D industrija ima problema sa skaliranjem više grafičkih kartica. Ali svi ti problemi će u nekom trenutku biti dovoljno minimalizovani da više neće privlačiti pažnju, a većini kupaca će biti normalno da kupuje Dual GPU kartice ili da u sistem postavi dva ili tri akceleratora, ako su mu neophodne više performanse. Do skoro je bilo logično da se prvo predstavi high-end GPU od koga će nastati derivat namenen srednjoj klasi, a onda i derivat koji bi zauzeo segmente od 50 do 100 dolara. Međutim, sa RV770, AMD je odlučio da kreira “derivate” i za višu i za nižu klasu. Klasičan “strip-down” GPU će biti napravljen za potrebe niže klase (verovatno 128-bit magistrala i manji broj shader i drugih jedinica nego što ih sada ima i RV670), dok se za višu klasu pravi klasično dual-GPU rešenje.
Arhitektura
Kao i prethodnik, RV770 je izrađen u istoj 55-nm tehnologiji, a za razliku od njega, koji se sastojao od 666 miliona tranzistora, novi GPU čini čak 956 miliona osnovnih semikonduktorskih elemenata, što je za ovaj proizvodni proces i površinu die-a u koji je spakovan, impresivna cifra. RV670 je imao površinu od 190 kvadratnih milimetara, a taj broj se povećao na 260 kvmm, što je opet vrlo prihvatljivo, čak i kada ga ne uporedimo sa sumanutih 576 kvmm koliko “zauzima” GT200 GPU. Prvi superkompjuter koji je nudio moć procesiranja od jednog teraFLOPS-a, izrađen je 1996. godine i sastojao se od skoro 10 hiljada (!!!) Intel Pentium Pro procesora na 200 MHz i trošio pola megavata struje uz obaveznih, dodatnih pola megavata koje je odlazilo, u isto vreme – na hlađenje! Samo dvanaest godina (što se, doduše, u IT industriji računa gotovo kao čitav vek) kasnije, AMD kreira grafičku karticu koja troši svega 110W a nudi istu processing moć! Nemamo informacije o tome koliko je 1996. godine koštao super-kompjuter ASCI Red, ali znamo da danas Radeon HD4800 košta svega par stotina dolara, pa i manje.
Shader, i…?
Radeon HD4800 GPU, po specifikaciji poseduje 800 stream processors jedinica, 40 TMU tj. jedinica za teksturni menadžment i 16 ROP procesora. Broj teksturnih jedinica je značajno povećan u odnosu na RV670 – sa 16 na 40, dok je broj render back-end unit-a ostao isti, što je i logično, s obzirom na magistralu koja je ka memoriji ostala na istih 256-bita. Kod jačeg modela, AMD to kompenzuje ultra-brzom GDDR5 memorijom, koja omogućava veći bandwidth i samim tim, adekvatno visoke performanse u opterećenim modovima, tj. u visokim rezolucijama. Razlika između modela 4850 i 4870 nije tako mala kao u slučaju Radeon HD3800 generacije. Novi “70-model” ima GPU koji radi na 20% višem taktu od “pedesetice”, dok je propusni opseg memorije na jačem modelu fantastičnih 80% veća! Zapravo, Radeon HD4870 sa 256-bitnom magistralom ima solidno veći bandwidth i od GeForce GTX260 kartice, koja koristi 448-bitnu magistralu. Osim prisustva GDDR5 memorije, Radeon HD4870 ima i prednost u odnosu na konkurente kada je “multimedia” u pitanju. RV770 poseduje osmokanalni LPCM zvučni kodek koji se ostvaruje putem HDMI veze.
Streaming processors jedinica kod RV770, kao što vidite, ima prilično mnogo, ali se one ne mogu u ovom obliku uporediti sa istoimenim procesorima kod G80 ili GT200 grafičkih čipova. Ako pogledamo dijagram SP jedinice, videćemo da je AMD zadržao njenu superskalarnu prirodu (NVIDIA i dalje koristi striktno skalarne jedinice). To znači da NVIDIA svoje jedinice naziva i broji kao 1-way skalarne procesore, dok AMD svaku od svojih “umnožava” sa pet, jer su u pitanju super-skalarne 5-way jedinice. O ovome smo opširnije pisali u našem prvom testu Radeon HD3800 kartica. Četiri segmenta svake SP jedinice kod RV770 čipa, dakle, obrađuju jednu floating-point operaciju po klok ciklusu (Multiple/Add), dok je peta sposobna za ovu skalarnu operaciju, uz mogućnost obrade jedne kompleksne specijalne instrukcije kakva je SIN, COS ili EXP. Svaka od jedinica radi u maksimalno FP32 (32-bit) formatu brojeva sa pokretnim zarezom, a uz njih, podsetićemo, stoji i posebna jedinica koja radi sa instrukcijama dinamičkog grananja, ali i set tzv. general purpose registers keš memorija, koje su slične deljenoj keš memoriji kod SP fragment procesora NVIDIA GPU-ova. AMD priča i o tome da je RV770 sposoban i za rad uz 64-bitnu preciznost (FP64), ali je tada teoretski processing maksimum na nekih 240 gigaFLOPS-a, što je opet skoro dva puta više od cifre koju je za GTX280 navodila NVIDIA. Ako neki od GP-GPU softverskih alata ikad bude zahtevao ovaj nivo preciznosti, videćemo koja će se od ove dve kartice i zaista bolje pokazati u realnom radu. SP jedinice su poređane u SIMD maniru (Single Instruction, Multiple Data) i to u vidu 16 blokova.
Svaki od 16 SIMD blokova poseduje osamdeset skalarnih SP jedinica koje podacima „hrani“ sada već poznati, ali poboljšani Ultra Threaded Dispatch Processor. Svako SIMD jezgro poseduje 16K sopstvene, deljene „keš“ memorije, kao i mogućnost međusobne komunikacije putem jedne posebne keš memorije (takođe 16K) kojoj svaki SIMD može da pristupa. Takođe, svaka SIMD particija ima i set od četiri teksturne jedinice (TMU), što novom AMD GPU-u daje shader : texturing odnosod 4 prema 1, dok ona kod GT200 čipa iznosi 3:1. Iako je NVIDIA ranije bila dosta konzervativnija kada je ovaj odnos resursa u pitanju (2:1 kod G80 i G92), izgleda da još nije pronađen balans koga bi se držala oba GPU dizajnera. Kada su poboljšanja na nivou Geometry Shader-a u pitanju, RV770 ima mogućnost da više generisanih podataka čuva u čipu pre nego što ih pošalje prema memoriji, uz četiri puta veći broj thread-ova u odnosu na prethodnika. Ovo je jako bitan podatak, jer su performanse geometry shader-a jako bitne za zdravu DirectX 10 funkcionalnost, a i napredni oblici tesselation metoda (sa kojima na je u primitivnom obliku upoznao još prvi Radeon GPU!) kroz DirectX 10.1 su još jedan dobar način da se poveća broj detalja na objektima uz uštedu u vremenu pri dizajniranju 3D scene, ali i uštedu u resursima GPU-a.
RV670 je imao manji problem pri prebacivanju režima rada sa integer na FP vrednosti, pa je njegov tzv. bit-shifter gubio po nekoliko klok-ciklusa pre nego što SP jedinice uposli za rad sa novim, drugačijim setom podataka. RV770 je u ovome i do 12.5x bolji, a kako ne možemo baš ovu tvrdnju tako lako da proverimo, ostaje da AMD-u verujemo na reč da se radi bar o približnoj cifri. AMD je takođe izračunao da su stream processing jedinice unutar novog GPU-a i do 40% bolje kada su u pitanju performanse po kvadratnom milimetru površine koju čip zauzima. Na kraju, možemo navesti i jednostavniju verziju priče – RV670 ima 64 5-way SP jedinice, RV770 ima 160 5-way jedinica, dok GT200 ima 240 1-way skalarna procesora koji, zauzvrat, rade na bar dva puta višem taktu u odnosu na one kod ATI procesora.
Ako želimo da, novi AMD GPU ipak uporedimo sa GT200 čipom i “prebrojimo” koliko koji GPU može da “izračuna” i koji su mu limiti, dolazimo do zanimljivih zaključaka. Broj registar bafer memorija u GT200 čipu, zbirno iznosi 1,88 MB, dok je kod RV770 ta brojka veća (2.5MB). Ovo je verovatno iznenađenje za sve one koji su videli koliko je GT200 veći od RV770 konkurenta. Maksimalan broj thread-ova koji se mogu obavljati po SIMD particiji je identičan i iznosi 1024, odnosno oko 30 hiljada po čipu za NVIDIA i oko 16 hiljada za ATI GPU.
Teksturne jedinice – TMU
ATI je sa R600 generacijom povećao odnos shader ALU jedinica prema onim koji su zaduženi za teksturni menadžment i to je jedan od razloga zbog koga za HD2900 kartice kažemo da su bile ispred svog vremena. Ovaj odnos je zadržan i kod RV670 GPU-ova, ali je nešto izmenjen kod poslednje generacije. AMD navodi da su performanse teksturne jedinice i do 70% veće kada se posmatra odnos performansi po milimetru površine GPU-a (i u odnosu na RV670). Kao što smo naveli, RV770 poseduje SIMD particije, a na svakoj od njih posebnu teksturnu jedinicu, od kojih svaka poseduje četiri ALU-a za adresiranje i šesnaest jedinica za sempling tekstura uz FP32 preciznost, kao i četiri jedinice za filtriranje u istom „režimu“. Broj SIMD particija je deset, što znači da RV770 poseduje 40 jedinica za adresiranje i filtriranje (tako dolazimo do brojke od „40 TMU-a“), kao i 160 jedinica za sepling u FP32 modu. Ako znamo koliko je TMU deo RV670 čipa slabiji, jasno je da od novog procesora možemo očekivati znatno bolje performanse, što će posebno biti vidljivo i u starijim igrama, koje se tradicionalno oslanjaju na multi-texturing, a manje na operacije sa shader-ima. Kada je pristup teksturama u pitanju, RV770 je još više „bursty“ (kako to Lord Huddy voli da kaže) nego prethodnik. L2 keš je postavljen bliže memorijskim „stanicama“ koje su direktno vezane za video memoriju, a svaka TMU jedinica na SIMD-u poseduje sopstvenu L1 keš memoriju, koja sa pomenutim L2 baferom komunicira brzinom od 384GB/s. L2 keš je izuzetno efikasan kada je pristup texture cache memoriji u VRAM-u u pitanju (čitavih 480GB/s je cifra koju AMD navodi). Veličine L1 i L2 keš memorija nam nisu poznate, ali znamo da su dva puta veće u odnosu na prethodnu generaciju, što teksturnu jedinicu RV770 čipa čini i do dva i po puta efikasnijom u filtriranju FP32 tekstura. Zanimljivo je da se AMD odlučio na to da TMU jedinice veže za SIMD, ali da instrukcijske i constant bafer memorije postavi na malo višu poziciju u „pajplajnu“, dok ih NVIDIA vezuje za SIMD. S druge strane, inženjeri kompanije iz Santa Clare su „izmestili“ TMU nešto dalje od SP jedinica, pa se ni u kojoj varijanti ne može reći da se nalaze u okviru istih segmenata GPU-a, iako pipeline kod Unified Shader GPU-ova nije kružan, niti jednosmeran, već se grana na velikom broju nivoa, a mnoge sub-jedinice mogu da komuniciraju međusobno, u zavisnosti od toga kakav se thread izvršava.
RV770, kao i prethodnik, podržava DirectX 10.1 verziju API-ja, tj. Shader Model 4.1. Nova podverzija Microsoft razvojnog okruženja, tj. interfejsa, direktno je kreirana oko specifikacije RV670 grafičkog čipa, ali je kod naslednika, ATI poradio dosta na poboljšanju Geometry Shader Engine-a. Najbitnije novine 10.1 verzije su podrška za cube map arrays koji omogućava poziv i upisivanje više cube map tekstura tokom jednog rendering ciklusa – funkcija koja je krucijalna za brži rad sa scenama u kojima je primenjeno globalno osvetljavanje (realtime global illumination), a koji izuzetno i značajno podiže realnost renderovane scene. Kontrola nad nezavisnim, hardverskim izvršavanjem antialiasing-a, koji je ATI predstavio na Xenos čipu, sada se direktnije kontroliše od strane same aplikacije upravo preko DirectX-a, što je stvar za koju je (ako nas pitate) bilo čudno što ranije nije bila podržana! Takođe, dodate su podrške za: ambient occlusion, gather 4, cube map arrays, sample pattern selection, pixel coverage mask i separate per-MRT (multiple rendering targets) blend modove. Ono što isto tako smatramo bitnim je i mogućnost da svaka aplikacija bude povezana sa posebno kreiranim antialiasing filterima (kao što developeri rade kada kreiraju igre za Xbox360) koje će Catalyst tim, nesumnjivo, obezbediti za bitnije naslove. Još jedna od novina koje su ponovo reaktualizovane, a bile su prisutne i kod RV670 zove se hardware tesselator i o njemu će biti više reči kasnije.
Render back-end i memorija
Jedan od problema sa kojim su se suočili testeri, ali i korisnici Radeon HD2900 i HD3800 serije kartica je definitivno vezan za performanse kada su uključeni algoritmi za umekšavanje ivica na objektima – tj. full screen antialiasing. Mnogi su to pripisivali suženoj memorijskoj magistrali, a opet, G92 tih problema nije imao, pa problem mora biti vezan za neku drugu manu RV670 čipa. RV770, zato, stiže sa unapređenom ROP, tj. render back-end jedinicom, koja je i zadužena za output pixel-a na ekranu, tj. za funkcije kao što je antialiasing. Međutim, ako RV770 opet ima četiri particije sa ukupno 16 ROP jedinica, baš kao i R600 i RV670, kako je moguće da su performanse ovog dela GPU-a, po kloku, bolje? Moguće je, jer je svaka ROP particija bar dva puta efikasnija od ROP-a kod prethodne generacije. RV670 je bio sposoban da prikaže osam piksela po kloku pri 2x ili 4x MSAA, dok RV770 može da „provuče“ šesnaest. Isti odnos važi i za 8x MSAA, s tim što je za oba GPU-a broj piksela po kloku dva puta manji. Broj stencil operacija nad pikselom je porastao na 64 (piksela po kloku), što je opet poboljšanje od 100%. RV770 ne donosi nove, snažnije AA modove, pa je ponovo maksimum postavljen na 8x za MSAA i Custom Filter AA algoritme, tj. metode umekšavanja ivica.
GDDR5 i memorijska magistrala
Sa R500 generacijom, ATI nas je upoznao sa RingBus memorijskim kontrolerom i odgovarajućom, kružnom memorijskom magistralom. Kružna, ne zato što vodovi između RingBus stanica, tj. delova kontrolera imaju kružni oblik, već zato što mogu i međusobno da komuniciraju i to dva puta širom magistralom nego što je ona prema memorijskim čipovima, pa je tako bilo lako da se interno njom “voze” podaci brzinom od čak 100 gigabajta po sekundi. RingBus je odličan pristup kada se barata sa ogromnim paketima podataka, ali se jednako koristi i kada je GPU opterećen samo delimično, kao npr. tokom gledanja filmova (kada je UVD aktivan) ili kada se radi u 2D režimu. U vreme koje ponajviše obeležava i takmičenje za što višom energetskom efikasnošću, tradicionalan RingBus je sličan Boeingu 747 koji pedesetak putnika vozi od Beograda do Tivta. Kod RV770, memorijskom kontroleru je dodat manje robustan, ali dosta štedljiviji switched hub, koji ne može da šalje pakete podataka dvosmerno, ali zbog svoje direkcione prirode, ima ukupnu širinu od čak 2048 bita, pa se zato propusna moć povećava na 192GB/s, ali se samo jedan njegov mali deo koristi, kada je to potrebno. Uz više radne frekvencije, nemogućnost kružnog putovanja podataka bi trebalo da bude kompenzovana, a latencije su dodatno smanjene, jer određen broj paketa u nekim situacijama neće putovati dužim delom „kruga“. Takođe, „izbacivanje“ RingBus-a je dovelo i do uštede u broju potrebnih tranzistora – „prsten“ ima svojih prednosti, ali je prilično zahtevan kada je die u pitanju. AMD se, dakle, vratio klasičnom crossbar memorijskomkontroleru od koga NVIDIA nikad nije ni odustala. Međutim, AMD-ov crossbar podržava GDDR memoriju treće, četvrte i pete generacije, a već smo ostali zaprepašteni efektivnim radnim taktom najbržih GDDR5 čipova.
GDDR3 je prilično „odomaćen“ standard – tu je još od vremena GeForce 6800 kartica, a u mainstream se preselio već u samom startu karijere (GeForce 6600GT modeli). GDDR4 je nekako ostao „rezervisan“ za ATI kartice, jer ga NVIDIA praktično nije ni koristila na svojim akceleratorima. GDDR5 će, pak, biti prevelik korak unapred čak i za arogantnu kompaniju kakva je Chipzilla, da je ignoriše. Da li čitava priča oko ne-usvajanja GDDR4 standarda od strane NVIDIA-e ima veze sa tim što je jedan od glavnih ljudi koji se bavi „guranjem“ ovog standarda unapred, člana JEDEC „komisije“, gospodin Joe Macri, radi u AMD-u, nismo sigurni, ali čak i da u tome ima samo trunka istine, složićete se da to zvuči veoma interesantno.
Šta novo donosi GDDR5? Prvenstveno, omogućava više radne učestanosti i bolji propusni opseg, ali to smo i očekivali. Odmah usvojen od strane JEDEC-a i glavna tri proizvođača memorije (Samsung, Qimonda i Hynix), GDDR5 je pažljivo razvijan već godinama unazad, a GDDR4 je poslužio samo kao „faza“ da se dostigne ono što će nuditi „petica“. Verovali ili ne, sa gospodinom Joe Macrijem smo diskutovali na temu GDDR5 memorije (radnim učestanostima, naponima i propusnom opsegu) još 2006. godine, kada je ATI, na Ibizi lansirao Radeon HD2xxx familiju kartica. I što vam može zvučati još neverovatnije je i da je tada g. Macri naveo da se na GDDR5 memoriji radi već preko 18 meseci. Nova memorija donosi veći „bandwidth po pin-u na layout-u čipa“, a naravno i veću propusnu moć uopšte. GDDR4 je maksimalno mogao da postigne 4GB/s po pin-u, dok GDDR5 može do osam, što znači da uparivanje GDDR5 memorije na 256-bitnu magistralu daje iste rezultate kao i upotreba GDDR3 memorije na 512-bitnom bus-u. GDDR5 ima i logiku koja omogućava „samo-adaptaciju“ latencija i tajminga za rad sa određenim tipom procesora. GDDR5, kao i GDDR4 poseduje naprednu detekciju grešaka, a svaki čip sada poseduje i termalni senzor koji nadgleda radne temperature i skokove napona. Adaptacija koju smo pomenuli nije neki komplikovani kod koji se izvršava in-hardware, već samo obezbeđuje bolju kontrolu izvoda na čipu, tako da više nije neophodno da se trace-ovi na PCB-u rutiraju na poseban način kako bi se postigao dovoljno „čist“ signal. Umesto toga, svaki modul se prilagođava svojim „putevima“ prilikom svakog novog dizanja sistema. Naponi koji se koriste kod GDDR5 memorija su oko 30% niže od onih kod GDDR3 standarda i blago više u odnosu na GDD4.
Tessellation
Kao što smo i gore napomenuli, hardverski tesselation tj. usložnjavanje 3D objekata pomoću logike samog GPU-a je nešto o čemu nismo pošteno diskutovali još kako je izašao R200 GPU (pogađate, to je ATI Radeon 8500). Nekadašnji TRUFORM je i NVIDIA nekada inicirala sa svojim verzijama higher order surfaces, dok je Matrox prošao neslavno sa svojim displacement mapping tehnikama i prvom generacijom Parhelia kartica. U vreme kada je razvijan R600 i kada je ova priča mogla da dostigne punu i konkretnu zrelost i bude podržana unutar API-ja, ATI je kreirao i sopstveni tesselator engine, o kome do sada nije preterano pričao iako ga poseduje i RV670 GPU. Na proleće prošle godine, AMD je predstavio programirani tesselator kroz upotrebu odgovarajućih vertex shader rutina, ali ne i DirectX 10 geometry shader-a, što je i bilo logično i zbog čega je i inicijalan zamajac za ovu tehnologiju izostao. Zapravo, prva generacija tesselation engine-a kod R600 je preuzeta iz nešto starijeg Xenos GPU-a (Xbox360 GPU i northbridge) i on može da se programira samo pomoću standardnih vertex shadera, dok je tesselator u okviru RV770 poboljšan i prihvata i geometry shader koji je i logičan za rad sa ovakvim tehnologijama. Kako bi demonstrirao svoju tehnološku superiornost – DirectX 10 tesselation engine i instancing koji rade pomoću geometry shadera DX10 API-ja, ali i global illumination, AMD je angažovao tim developera i Natashu Tatarchuk, koja je kreiran je demo koji je nazvan Froblins. Male kreature, njih na hiljade (instancing), na ogromnom prostranstrvu, svaki osečnen “globalno” (GI), sa ogromnim brojem detalja (tesselation), na kompleksnom terenu (geometry shader) i razmišlja za sebe (GPU pathfinding)… ovo je prvi put da GPU kroz DirectX 10 učestvuje i u kalkulaciji veštačke inteligencije!
Unified Video Decoder engine 2.0
Prva generacija AMD Unified Video Decoding engine-a (Richard Huddy me je već jednom ispravio jer sam ga nazvao Universal, ali izgleda da ga tako svi i dalje nazivaju i ne obaziru se na ono što piše u tehničkoj dokumentaciji – prim. aut.) je već dovoljno savršena i o njoj smo više puta pisali. NVIDIA grafičkih procesori od G84 na ovamo, kao i nova familija Radeon HD2000 (bez 2900XT i Pro modela) i HD3000 akceleratora imaju posvećeni video processing engine koji ATI naziva Unified Video Decoder. U odnosu na AVIVO, UVD je napredovao koliko i PureVideo HD druge generacije u odnosu na rešenje iz GeForce 7 familije, a nakon njegovog izostanka ili nefunkcionalnosti kod R600 kartica, našao je svoje mesto kod aktuelne HD3800 serije. AMD tvrdi da je smanjenje CPU utilizacije pri posmatranju H.264, a posebno VC-1 video formata, koji su postali standardni video kodeci za BluRay naslove zaista vredno pažnje, čak i na desktop sistemima. Prilikom obrade HD video signala, pred grafičkom karticom stoji izazov koji se ne završava samo na procesiranju bar 6x više informacija u odnosu na video signal standardne definicije. Jednostavno rečeno, grafičke kartice poseduju specijalnu logiku koja im objašnjava kako da brojne shader jedinice iskoriste za obradu video signala. Pošto su GPU-ovi sve moćniji, zbog čega stati na 1080p rezoluciji? AMD je proširio podršku i za XHD rezolucije, što nam nije teško da zamislimo jer, ako ove kartice bez problema rade sa stotinama tekstura visoke rezolucije koje “lepe” na hiljade poligona u 3D igrama, zbog čega ne bi mogle da, tridesetak puta u sekundi, nalepe jednu “teksturu” na jednu površinu na ekranu. Naravno, jasno je da se na tu “teksturu” primenjuju malo zahtevniji algoritmi od običnog trilinear ili anisotropic filtera, brinuti o daljem toku podataka, korekciji i kompenzaciji pokreta, de-interlacing-u i tome slično, ali je sve to, složićete se, i dalje manje kompleksan “shader program” od “sličnih” rutina u modernim igrama.
Početne BitStream i Entropy Decode faze se sada izvršavaju od strane GPU-a. UVD je kreiran da u potpunosti dekodira i najzahtevnije (i najnaprednije) video kodeke kakvi su VC-1 i H.264, uključujući i bitrate od 40 Mbps ili više i koristi već postojeća, programabilna SIMD jezgra, odnosno Stream Processors jedinice. Ono što novi Radeon HD4800 GPU-ovi podržavaju, a od nedavno i konkurencija sa novim GPU-ovima, naziva se full-speed CABAC i CAVLC dekodiranje u okviru H.264 i VC-1 kodeka. Sav postprocessing se obavlja unutar shader jedinica, uz primenu filtera koji su ništa drugo do namenski kreirani shader programi koji se u potpunosti izvršavaju in hardware. HDMI, odnosno High Definition Multimedia Interface je u potpunosti podržan od strane RV670 GPU-a, zajedno sa obaveznim HDCP (High-bandwidth Digital Copy Protection) sistemom zaštite od kopiranja. Osim digitalnog signala, HDMI konektor “prenosi” i više kanalni audio zvuk, koji RV770, kao i RV670 i R600, podržava. Kod prethodnika je to bio 5.1, 16-bit PCM Stereo ili kompresovani AC3 5.1 više kanalni audio-stream po Dolby Digital i Dolby DTS standardima, ali je to kod RV770 dovedeno na viši nivo – sada je podržan osmokanalni (7.1) audio uz maksimalan bitrate od 6.144 Mbps i sempling od 192KHz. Podrška za “filmske” formate se ne zaustavlja na Dolby DTS i Digital standardima – tu su sada i True-HD i DTS HD formati u koje se “slažu zvučne slike na novim BluRay izdanjima. Novina je i podrška za DisplayPort interfejs iz samog čipa.
Još jedna od bitnih novina je i mogućnost dual-stream plejebeka, pa RV770 može da pusti dva HD video feed-a i to u modu “slika-u-slici” sa kompletnim de-kodiranjem kroz VC-1, H.264 i MPEG-2 (uz upscaling DVD formata u HD rezolucije i nove profile sa dinamičkim kontrastom). AMD će uskoro na websajt pustiti i novu aplikaciju Accelerated Video Transcoding koja će omogućiti transkoding HD video formata u MPEG-2 ili H.264 i to oko 19 puta brže nego Intel Core 2 Duo E8500 CPU (mereno za klip u 1080p rezoluciji). Ovaj algoritam će se pojaviti i u obliku plug-in-a za Cyberlink's PowerDirector aplikaciju, a ubrzo i druge popularne programe.
Ekološki procesor, GP-GPU i drugi noviteti
Prvi štedljivi i balansirani GPU kompanije AMD je svakako bio R670, tj. Radeon HD3800 grafički procesor, pa su ove procesore lansirali gotovo u isto vreme i u mobilnim varijantama (Radeon Mobility HD3000). I Radeon HD3870 nudi impresivan power management i dosta uštede kada je u idle režimu, a sa Richardom Huddy-jem smo pričali i o tome da sam GPU poseduje više performance stanja. RV770 poseduje in-GPU kontroler koji prati temperature i opterećenost shader blokova GPU-a, kao i PCI Express magistralu. Kada zaključi da opterećenje nije visoko, clock gating praktično isključuje čitave delove GPU-a koji u tim ciklusima nisu potrebni. Lord Huddy nam je, na pitanje “Da li se u tom slučaju nekoliko ciklusa izgubi, pre nego što se GPU probudi i potpuno “profunkcioniše”, odgovorio potvrdno, ali s obzirom na takt od 600 i više miliona ciklusa u sekundi, teško da postoji načn da se ti gubici mogu izmeriti, a kamoli primetiti. Ista kontrolna logika vodi računa o radnim učestanostima, temperaturi i naponu GPU-a te “govori” ventilatoru na kom broju obrtaja treba da hladi karticu.
Pisali smo o NVIDIA GP-GPU inicijativi i koliko se njihov pristup razlikuje od dosadašnjih general purpose inicijativa koje su se mahom oslanjale na grafički API, a ne na potrebu programera da prekompajliraju softver u CUDA okruženju (ekstenzija programskog jezika C). Stream Computing je ATI-jev naziv GP-GPU inicijative koja omogućava da se standardni softver na pravi način izvršava na GPU-u i iskoristi njegove jezivo velike parallel processing resurse. AMD se, pak, oslanja na kompaniju Apple i njihovo interesovanje u smeru OpenCL ekstenzije programskog jezika koji je po sintaksi takođe sličan popularnom “Ce-plus-plusu”. Najčudnije od svega je što se pred pripremu ovog teksta pojavilo dosta potvrđenih informacija i vesti o tome da Radeon HD4800 kartice sasvim lepo rade sa CUDA aplikacijama i da su čak vrlo konkurentne NVIDIA GT200 akceleratorima. O GP-GPU inicijativi kompanije AMD još uvek ne može mnogo toga da se kaže, ali su tokom predstavljanja novog GPU-a ispred kompanija Adobe pričali o konkretnom rekompajliranju Photoshop CS4 softverskog paketa za dve, do tri standardne GP-GPU tehnologije. I na kraju, pomenućemo da RV770 podržava CrossFire i CrossFire X za vezivanje dve, tri ili četiri grafička jezgra u jedan sistem, ali ćemo i ovoj temi više pažnje posvetiti nekom narednom prilikom (kada se pojavi Radeon HD4870X2).
Konkretno… Radeon HD4870X2
Nakon uspešnog koncepta koji je doneo model Radeon HD3870X2, sasvim je bilo za očekivati da će i Radeon HD4870X2 koristiti isti recept jedne štampane ploče sa dva GPU-a. Ovaj dizajn nudi mnogo bolju energetsku efikasnost, a sada je AMD inkorporisao i novi PCI-Express bridge čip koji je „zakasnio“ za implementaciju na prethodnu X2 karticu. Ovaj bridge čip je „krivac“ za još bolje skaliranje kod R700 akceleratora. Zbirna snaga koju nudi Radeon HD4870X2 izražena u TeraFLOPS-ima je 2.4 TFLOPS, što je dosta više od direktnog konkurenta koji pruža svega 0,93 TeraFLOPS-a. Memorijski propusni opseg je narastao na 230 gigabajta u sekundi, što je opet daleko više od 141 GB/s kod GeForce GTX280 kartice. Pixel i Texel Fillrate su takođe bolji, pa, kao što možete videti u tabeli, iznose 24 Gigapiksela, odnosno 60 Gigateksela za R700 karticu (i 19, odnosno 48 Gigateksela kod najjačeg konkurenta). Ova kartica košta nešto manje od dve Radeon HD4870 kartice, što bi na našem tržištu trebalo da znači da će koštati manje od 460 evra. A za one kojima je Radeon HD4870 malo, a X2 im je preskup, AMD je namenio Radeon HD4850X2 koji „samo što nije“.
Čitaoci bi mogli da prokomentarišu da je AMD-u bilo lako da dizajnira Radeon HD4870X2 jer je on HD3870X2 sa novim GPU-ovima, ali R700 krije još nekoliko noviteta. Dakle, ne svodi se sve samo na RV770 čipove. Ako se setimo, Radeon HD3870X2 je koristio PCI Express bridge čip pomoću koga su GPU-ovi komunicirali maksimalnom brzinom od ukupno 6.8 GB/s. Međutim, kao što je gore vrlo lepo prikazano, između RV770 čipova sada stoji poseban „most“, zahvaljujući posebnim delovima na GPU-u, koji ih „drži“, a koji AMD naziva sideport. Osim što pojednostavljuje sam layout između čipova, on povećava i propusnu moć magistrale kojom komuniciraju ova dva GPU-a. Komunikacija je direktnija, a i ubrzana je više od tri puta pa sada iznosi 21.8 GB/s. Kako je AMD ovo izveo? Pogledajmo opet dijagram iznad (kliknite za veću sliku): dve sideport konekcije koje imaju propusnu moć od 5GB/s u oba smera (kao i PCI Express 2.0). Ovim linkom komuniciraju sami GPU-ovi i vrše podelu posla (zapravo, podelu posla vrši kopajler zajedno sa dispatch jedinicom, ali informacije o tome putuju ovim, najbržim putem). Prvi je, i dalje, na neki način – “master”, a drugi je njegov sluga. Međutim, tu je i CrossFire bridge kojim „putuju“ već pripremljeni frejmovi ili delovi frejmova (u zavisnosti od CrossFire režima, naravno) – na finalni composing.
Ako još jednom sumiramo, videćemo da je Radeon HD4870X2 i u teoriji najbrža kartica na svetu i da je u realnom radu, na putu ka tronu mogu spotaći samo drajveri (nadamo se da neće). Nudi 2.4 TeraFLOPS-a grafičke i GP-GPU moći, ima ukupno 1600 stream jedinica i 2 GB GDDR5 memorije. AMD međutim, nije zaboravio ni na neke „sitnice“ poput Unified Video Decoder 2 engine-a, o kome smo više puta pisali, zatim XHD upscaling 1080p video materijala, HDCP i HDMI interfejsa (i zaštite) sa kompletnim in-vivo audio kodekom. Kao i Radeon HD4850 i HD4870 – i X2 kartica podržava PowerPlay tehnologiju, koja, za početak, omogućava da kartica troši jako malo kada je u stanju mirovanja (idle). Pogledajmo kako se na našem testu pokazala ATI-jeva refference sample Radeon HD4870X2 kartica…
Kartica na testu – AMD ATI Radeon HD4870X2
Radeon HD4870X2 kartica koju smo testirali je glomazna i teška, ali to smo, nakon HD3870X2 modela i očekivali. Uostalom, od nje nije (mnogo) duža – obe su dugačke oko 300 milimetara, pa će teško stati u manja midi kućišta. Masa kartice je 1060 grama, što nije malo (GTX280 ima 922, a HD4870, referentni – 790 grama). Dual RV770 akcelerator ima, naravno, veliki dual-slot hladnjak. Stigla nam je bez dodatne opreme, pa ćemo se fokusirati samo na hardver koji je čini. Radeon HD4870X2 ima dva DVI porta, oba Dual Link tipa i oba sa HDCP komponentom, ali samo jedan sa trojtvom – HDMI, HDCP i Audio i upravo na njega je potrebno povezati DVI-HDMI adapter, kako bi zvuk iz integrisanog Realtek HD Audio kodek „čipa“ mogao da pokaže šta ume (a to je više kanalni, 7.1 audio sa podrškom za koding naprednih Dolby (DTS) formata). Tu je i S-Video-liki konektor, kakav na ATI karticama viđamo već čitavu deceniju…
Najveći deo mase kartice čini njen hladnjak, koji je verovatno i najmasivniji i najgabaritniji ikad viđenih na jednoj grafičkoj kartici. Radeon HD4870X2 vizuelno najviše podseća na svog starijeg X2 brata, sa kojim deli i feature-set: DirectX10.1 i Shader Model 4.1, UVD 2.0 i 7.1 HD surround zvuk. HD4870X2 poseduje dva RV770 GPU-a, oba podešena na 750 MHz, kao i 2GB GDDR5 memorije – po gigabajt na sopstvenoj 256-bitnoj magistrali. Memorija je setovana na 900 MHz, ali pošto je u pitanju GDDR5, koji praktično i nije DDR, već QDR, efektivan „takt“ iznosi 3600 MHz. Zbirno posmatrano, na kartici je i gotovo dve milijarde osnovnih poluprovodničkih elemenata.Bilo nam je zanimljivo da vidimo da je PCB crne boje: moguće je da je i AMD prešao na “tamnu stranu”, jer nam se baš ovakva, Radeon HD4870X2 kartica najviše dopada. Deluje za klasu ozbiljnije i bukvalno morate da joj pokažete poštovanje.
Na kartici uočavamo dva konektora za eksterno napajanje. Za razliku od modela HD4870, koji ima dva PCI Express x16 naponska priključka, X2 teškaš ima 6-pin + 8-pin kombinaciju. Takođe, za razliku od single-GPU rođaka, HD4870X2 ima samo jedan Crossfire konektor, jer ovu karticu svakako nećete vezivati sa više od još jedne takve. Kartica ovih gabarita svakako traži prostrano kućište i, što je još važnije, dobro sistemsko napajanje. S obzirom da AMD navodi da može da povuče 282W struje, neki minimum koji mi preporučujemo je 650W, ali bi dobro došao i neki model od oko 800W, jer ceo sistem, pod opterećenjem, ume konstantno da troši oko 480-500W, što svakako nije malo. Dual GPU karticu ne možemo porediti sa modelima koji imaju jedan GPU, ali svakako moramo skrenuti pažnju na to da je ona zaista vrela i da joj svakako morate obezbediti prostrano i veoma dobro provetreno kućište, kako bi što manje zagrevala ostale komponente.
Radeon HD4870X2 poseduje glomazan dual-slot kuler, koji se, naravno, sastoji od više osnovnih delova, kao i kuler na prethodniku ove kartice. Dve bakarne baze prekrivaju jezgra i posebno su obrađena kako bi što bolje legla na RV770 čipove. GPU koji je bliže ventilatoru će, tako, gotovo uvek biti hladniji od drugog, jer preko njega prelazi već zagrejan vazduh. Upravo zato je i sama baza drugog GPU-a nešto masivnija. Aluminijumski radijatori hlade memorijske čipove, gusto spakovane oko GPU-ova, između kojih je i poseban PCI-Express bridge čip. Sa druge strane štampane ploče, nalazi se još jedan metalni deo koji prekriva drugih 2 x 512 MB memorije, smeštene oko izvoda GPU-a, na istim mestima na kojima su i njihove “kolege” sa osnovne strane PCB-a. Aluminijumski profil hladi i mnoge PWM i druge komponente na štampanoj ploči. Vazduh koji se uvlači pomoću velikog, moćnog ventilatora, prima toplotnu energiju iz bakarnog saća kome toplotna energija ovoga puta nije predata putem dva para toplotnih cevi, jer nema kombinacije aluminijum-bakar (praktično čitav osnovni deo kulera je načinjen isključivo od bakra). Karticu, nažalost, nismo rasklopili zbog nedostatka raspoloživog vremena, ali slike samog PCB-a možete naći na raznim forumima.
Sam PCB je na svakom svom delu površine “ispunjen” elektronskim komponentama. Na mestima na kojima nisu grafički čipovi, memorija i naponska jedinica, videćete gomile rezistora i kondenzatora. Odmah se mogu identifikovati dva 55-nanometarska RV770 grafička čipa, kao i PCI Express PLX čip druge generacije (podržava PCIe 2.0, za razliku od onoga kod Radeon HD3870X2 kartica). Kartica je podešena na iste radne učestanosti kao i HD4870 sa jednim RV770 jezgrom, što znači da oba čipa na X2 modelu rade na 750 MHz, dok memorija “kuca” na 900 MHz, odnosno 3600 MHz efektivnog takta (GDDR5 ima dva puta veći bandwidth po pin-u u odnosu na GDDR3). Svako jezgro ima svoje izvode ka memoriji, ukupne širine 256-bita kao i sideport izvode i linije ka PLX čipu. Impresivno je kako je sva ova elektronika stala na tako malu PCB površinu. Centralni PLX PCI Express 2.0 (PLX Technology PEX 8647) switch čip je vezan između RV770 GPU-ova. Ovaj čip poseduje 2 x 16 PCI Express linija za svaki GPU i 16 za PCI Express slot.
Ugrađena memorija je stigla od kompanije Hynix i ima oznaku H5GQ1H24MJR TOC i ima rating od 4 gigabita po sekundi, a na HD4870X2 kartici je podešena na 900 MHz. Na kartici postoji 16 ovih čipova, oko četiri sa svake strane PCB-a, oko svakog GPU-a. Tokom overkloking sesije, temperature GPU-ova se penju iznad 100 stepeni celzijusa, ali kartica, bar na utvrđenom maksimumu, radi savršeno stabilno iako je bučnija od Radeon HD4870 modela, a pogotovo od GTX280 konkurenta. Ipak, ta buka nije toliko izražena, ali je svakako možete osetiti…
Test Setup
PCI Express kartice smo testirali na test sistemu prikazanom u tabeli:
Procesor
Intel Core 2 Quad Q6600 @ 3600 MHz (400 MHz x 9), 1600 MHz QPB
Matična ploča
ASUS P5K Premium Black Pearl 18th Anniversary Edition
Memorija
2 x 1Gb Geil PC2-8500 1066GHz @1200MHz 2.25V
Hard Disk
Samsung SpinPoint SATA II, 320 GB, 16MB
Western Digital Caviar 2500JS SATA II 250 GB, 16MB
Video Karte
Gainward Bliss 8800 GT – (512MB DDR3) – Forceware 169.28
Gainward Bliss 8800 GTS 512 – (512MB DDR3) – Forceware 169.28
GeForce 9800 GTX (768MB DDR3) – Forceware 175.19
MSI N280GTX OC- 1024 MB DDR3 – Forceware 177.39, 175.19
Gigabyte GeForce GTX280 – Forceware 177.39
ASUS EAH3870 X2 (1024MB DDR3) – Catalyst 8.2b
ASUS EAH4850 512MB (512MB DDR3) – Catalyst 8.7 with fix
Radeon HD4870X2 2048MB (2048MB) – Catalyst 8.8b
Monitor
Samsung SyncMaster 244T / 245T
Cooling, Case, PSU
CoolerMaster GeminII
CoolerMaster Stacker 832 / WaveMaster
CoolerMaster Real Power 850W SLI & CrossFire Certified
DVD uređaj
Pioneer DVR-112L
DVD uređaj
Pioneer DVR-108D
Operativni sistem
Windows XP Service Pack 2 (optimized for performance)
Windows Vista (default)
DirectX 9.0c
DirectX 10
Igre/Bench programi
3D Mark Vantage
3D Mark 06
SPECORG SpecVIEW Perf 8.1
Enemy Territory: Quake Wars
Prey
Company of Heroes 1.3
Battlefield 2142
Unreal Tournament 3
Lost Planet: Extreme Conditions
Call of Duty 4: Modern Warfare
Half Life 2: Episode Two
Assassin's Creed DX10.0
Crysis 1.1
The Elder Scrolls IV: Oblivion
Need For Speed: Carbon
Need For Speed: ProStreet
X3 Reunion Demo Benchmark
World in Conflict
S.T.A.L.K.E.R
F.E.A.R 1.08
ATI kartice smo testirali sa Catalyst A.I podešenim na Standard. Ako je AF bio uključen, to je podrazumevalo Quality setting, dok su Adaptive i Temporal anisotropic filtering bili isključeni. Wait for vertical refresh odnosno Vertical Sync smo isključili. Kod nVidia kartica, podrazumevani mip-map setting je Quality, trilinearne optimizacije su uključene, anisotropic mip filter i sample optimizacije isključene, a gamma correction pri antialiasingu uključen. S obzirom na to da se NVIDIA kartice testiraju sa teksturnim filterom podešenim na High Quality (default je Quality), dobijeni rezultati su možda niži u odnosu na rezultate koje bi neko drugi mogao da dobije na sličnom test sistemu.
FutureMark 3DMark 06 Pro
Novo izdanje 3DMark benchmarka može da se izvršava samo sa Direct X 9 kompatibilnim akceleratorima. Tri prerađena testa iz prošlogodišnje verzije koriste Shader Model verzije 2.0, dok najnoviji zahteva SM3.0 i 256 MB video memorije Sva tri game demoa su izuzetno zahtevni, karakteriše ih još veći broj poligona koji opterećuje VS jedinicu, kompleksni shader programi (mapiranje neravnina, osvetljenja, emulacija pravog HDR osvetljenja, particle efekti, dinamične i meke senke, subface scattering, napredni fog efekti (emulacija volumetric efekta), ali i dosta postprocesing efekata. Novi test – Deep Freeze je grafički najimpresivniji, a novi 3DMark ima i napredni CPU test, koji simulira upotrebu A.I. rutina u igrama, kao i kalkulacije vezane za samu fiziku.
FutureMark 3DMark Vantage
Iako nije toliko vizuelno impresivan kao njegovi prethodnici, 3DMark Vantage je zapravo dosta bolje osmišljen GPU i gaming benchmark uopšte. Pažnja je ovoga puta usmerena na funkcije koje se izvršavaju ili će se uskoro izvršavati unutar igračkih “endžina”, a ne na sam artwork. Prvi od dva grafička testa, Jane Nash (Graphics Test 1) testiraju simulaciju tečnih povšina i generisanih tekstura, kao i GPU-kalkulisane sisteme čestica, a u čitavoj sceni se u realnom vremenu u obzir uzimaju i uticaj gravitacije na objektima (pa i na “objektima” glavne junakinje), zakon inercije i impulsa sile (prva dva Njutnova zakona), kao i zakon akcije i reakcije, uz uticaj otpora vazduha. Fiziku kalkuliše GPU, a da sve ne bi ostalo samo na kalkulacijama “ispod”, 3D scena je opterećena brojnim dinamičkim izvorima osvetljenja sa kompleksnim senkama, a voda, koja je refleksivna i refraktivna, se ne pomera na predefinisan način, već se svaki talas u realnom vremenu i dinamički generiše. Drugi test, New Calico, podseća na igru X3:The Threat i ne sadrži objekte sa skinovima (bez zglobova), ali zato poseduje ogroman broj objekata u sceni, sa shadow mapama različitog tipa. Po prvi put u 3DMark benchmark programu, prisutni su i global raytracing efekti ((Parallax Occlusion Mapping, True Impostors i volumetric fog). Treći test pokušava da izmeri performanse CPU-a u kalkulacijama veštačke inteligencije i fizike. Broj “gejtova” kroz koje proleću avioni je srazmeran broju jezgara sistemskog procesora, a ako u sistemu posedujete i hardver za kalkulaciju fizike (PPU), ovaj broj se povećava za tri. Nakon, standardnih, na red dolaze i “sintetički” testovi: texture fillrate, color fillrate, paralax occlusion mapping, gpu clothing, particles, noise…
SpecORG SpecVIEW Perf 8.1
Koristili smo poslednju aktuelnu verziju koji se sastoji od čak osam celina. SpecviewPerf meri performanse sistema pod OpenGL API-jem tako što simulira osam standardnih industrijskih aplikacija. 3Dsmax-03 je bayiran na SPECapc za 3dS MAX u OpenGL okruženju. U sceni su tri modela sastavljena od po približno 1.5 miliona vertices-a, a testiranje se vrši uz nekoliko tipičnih tipova osvetljenja. Catia-01 je bazirana na Dassault CATIA inžinjering aplikaciji u kojoj modeli imaju do dva miliona osnovnih linija. Ensight-01 je simulacija CEI EnSight inžinjering aplikacije koja se koristi za vizuelizaciju. U test su ubačeni displej-list i fast preview modovi rada. Light-07 je baziran na Discreet-ovoj Lightscape aplikaciji koja koristi realtime radiosity senčenje. Maya-01, kako joj i samo ime govori, simulira radno okruženje paketa kompanije Alias – Maya 5, nezamenljivi alat filmadžija u Holivudu. Proe-03 je baziran na SPECapc okruženju za Pro-Engineer 2001, koji u sceni primenjuje dva modela u tri shade moda (senčeni, wireframe i hidden-line removal). SW-01 simulira Solidworks 2004 aplikaciju, koju izdaje Dassault Systems i konačno, test Ugs-04, baziran na SPECapc Unigraphics V17 aplikaciji (odnosno simulaciji iste), u kojem je prikazan model motora sastavljen od preko četiri miliona osnovnih linija.
Lost Planet: Extreme Condition
Lost Planet: Extreme Condition je za Xbox360 izašao početkom 2007 godine, a nešto više od godinu dana kasnije, pojavio se i u verziji za Windows XP i Vista platformu sa podrškom za rad kroz DirectX 9 i DirectX 10 API-je. Kao i u verziji za Xbox360, poseduje veliki broj “next-gen” efekata, uključujući i filmske efekte poput full-frame motion blur-a, depth of field-a, a posebno se ističu napredni particle efekti koji verno oslikavaju žestoke zimske uslove, vatru, paljbu iz futurističkog oružja i sl. Na Microsoft konzoli radi u 720p rezoluciji sa oko 30-35 fps, ali kako podržava više radne rezolucije na Windows platformi (rezolucije tekstura, poligoni i sl. su identični Xbox360 verziji), predstavlja dosta dobar alat za testiranje novih grafičkih kartica. Iako gotovo tri godine nakon što je završena, igra po današnjim standardima ne izgleda impresivno, ume da bude prilično zahtevna. Mi smo testirali kroz prvi “built-in” test, uz maksimalan nivo detalja, u DirectX10 okruženju pa pogledajmo rezultate:
Call of Duty 4: Modern Warfare
Za razliku od prethodnika, Call of Duty 4: Modern Warfare igrača postavlja u okršaje novijih datuma. Baziran je na unapređenom “motoru” svojih prethodnika, posebno verzije iz trećeg dela, koji se pojavio isključivo u verziji za Xbox360 konzolu. Iako smatramo da bi rezultati koje daje sa današnjim hardverom (kraj 2007. godine) mogli biti veći, ipak je u pitanju dobro optimizovana igra: broj detalja odnosno dešavanja u sceni u svakom trenutku je fantastično veliki, bilo da su u pitanju sitnice poput mapiranja neravnina, bloom i HDR efekti, dinamičke senke i osvetljenja, efekti eksplozija i dima ili sveprisutni depth-of-field tokom zumiranja. U igri svaki metak prolazi kroz materijale kroz koje bi prošao i u realnoj borbi (drvo, staklo, tanak metal), uz adekvatno usporenje i izmenu pravca. Igra koristi isključivo DirectX 9.0c, odnosno Shader Model 3.0, a u verzijama za Xbox360 i PlayStation 3 izgleda kao i sa maksimumom detalja na PC-ju, kako smo je i mi testirali. Pogledajmo rezultate:
Enemy Territory: Quake Wars
Multiplayer igra u Quake univerzumu, koja cilja publiku “navučenu” na Battlefield, Team Fortress i Unreal Tournament, zapravo je svojevrsni prequel Quake-a II i njena radnja je smeštena na Zemlju, u sred sukoba Strogg-ova i ljudi. Novi Doom 3 MegaTexture engine u ETQW je negde na pola puta do pravog naslova sledeće generacije (koji ćemo u različitim verzijama videti u igrama Doom 4 i Rage), ali je princip rada identičan. Engine se oslanja na OpenGL i baziran je na mapiranju terena i svih objekata jednom mega-teksturom koja se direktno “ucrtava” na geometriju. Ova pametna, gigantska tekstura objektima daje i svojstva, što developerima igara daje puno slobode pri kreiranju ogromnih, detaljnih terena i vrlo unikatnih objekata (teksture se ne ponavljaju). Iako prva Doom 3 MT igra ne izgleda toliko impresivno (Crysis je ipak postavio neke standarde isuviše visoko), vrlo je dobro optimizovana. Testirali smo, naravno, na maksimalnom nivou detalja…
Prey
Jedna od najzanimljivijih i najinventivnijih “pucačina”, koja stiže od kreatora “čuvenog” Duke Nukema, igra Prey zadržava sve osobine klasičnog First Person Shootera, u koji uvodi elemente izmene gravitacije, letenja u Descent stilu, a tu su i delovi koji traže da uključite “vijuge” kako bi pronašli ostatak puta. Izrađena oko modifikovanog Doom III engine-a (kome je dodata “Portal” tehnologija), Prey je vizuelno izuzetno atraktivan, a igra je, iako dobro optmizovana, vrlo “stresna” za grafički podsistem. Kao i uvek, testirali smo sa najzahtevnijim “setup”-om, ali smo ovoga puta izbacili i kompresiju color i specular tekstura – što znači daje aktiviran Ultra Quality (koji se uključuje iz konzole) mod.
X3: Reunion
X3 Reunion je igra koja vam omogućava da iskusite život u svemiru, u dalekoj budućnosti. Možete graditi, trgovati, boriti se ili biti samo istraživač. Naravno, igra ne bi bila toliko zanimljiva da nije grafičkih dostignuća koji se mogu opisati samo superlativima. Iako nema nekih do sada neviđenih tehnologija, modelima brodova su bogato dizajnirani, raznovrsni i po tipu, i po veličini i po ulozi koju imaju, sa velikim brojem poligona (često preko pola miliona po sceni) , opskrbljeni fantastičnim color i displacement (bump) teksturama. Okolina (sam svemir, planete, asteroidi, magline…), kao da je još impresivniji, pa vas ova igra uvlači u priču i svet i samim gledanjem rolling demoa.
Company of Heroes 1.3
Prva real-time strategija u našem test-suite-u, Company of Heroes, koristi posebni next-gen engine koji Relic naziva “Essence Engine”. Ovaj engine podr žava sve nove fancy efekte kao što su High Dynamic Range i dinamičko osvetljenje, per-pixel senke, a displacement (normal) mapping je vidljiv na mnogim objektima. Takođe, igra se obilato oslanja na napredne shader rutine, ali i licenciranu Havoc fiziku, a pojedini objekti su destruktabilni, što donekle važi i za teren. Kao i obično, u igri smo uključili sve moguće efekte, što se po frame-rate-u i vidi:
World in Conflict
Druga real-time strategija u našem test-suite-u, World in Conflict, verovatno je i dalje najimpresivnija RTS igra koja je izašla na PC tržište. Bazirana je na novom Direct3D “endžinu” koji podržava čitav spisak novih efekata kakve smo do sada viđali samo u, po pravilu najinovativnijim FPS igrama. Dakle, tu su HDR, bloom i dinamičko osvetljenje, per-pixel senke, destruktabilni teren i adekvatni view-sight, paralax i normal mapping, depth of field i čitav niz drugih filmskih postprocessing efekata . Naravno, mi smo testirali sa maksimalnim nivoom detalja:
Battlefield 2142
Umesto igre Battlefield 2, koristili smo novi Battlefield 2142, smešten u periodu dva veka nakon Drugog svetskog rata. Igra je patch-ovana na 1.10 verziju (aktuelnu v1.50 ne koristimo zbog baze rezultata za kartice koje smo već testirali). Ova igra je bazirana na istoj mašini kao i Battlefield 2, ali uz nekoliko dodataka u koje spadaju detaljnije teksture, povremeni normal mapping, parallax mapping, dinamičko osvetljenje i senke, post processing efekti. Igru smo testirali na najvišim setovanjima na jednoj od zahtevnijih mapa. Pogledajmo rezultate:
Unreal Tournament 3 Demo
Unreal Engine 3 je najpopularniji “motor” koji koristi poslednje dve generacije DirectX API-ja i pored CryEngine 2, predstavlja trenutni “vrh ponude” kad je igračka industrija u pitanju. Nema potrebe da nabrajamo šta sve podržava, samo ćemo pomenuti neke prelepe naslove koje ste verovatno već videli ili igrali: Bioshock, Rainbow Six: Vegas, Medal of Honor: Airborne, BlackSite: Area 51, Gears of War, Mass Effect, Stranglehold i plejada drugih igara koje su već izašle u verzijama za Xbox 360 ili su u najavi… Demo Unreal Tournament 3 igre ne omogućava maksimalan već samo visok nivo detalja kad su u pitanju teksture, međutim, i ovo je dovoljno zahtevno da i najnovije grafičke kartice stavi na muke.
Assassin's Creed DirectX 10.0
Smeštena u vreme Templata, u drevni Jerusalim (ali zapravo i u blisku budućnost), igra Assassin's Creed je akciona igra sa elementima šunjalice, koja se izvodi iz trećeg lica. Pokreće je revolucionarni engine koji je razvijan za konzole aktuelne generacije (Xbox360 i PS3), ali tek na PC-ju pokazuje koliko zaista može, jer može da radi u značajno višoj rezoluciji od one koja je za konzole standardna (1280 x 720 piksela). Igra koristi sve napredne shader tehnike koje možete videti u najmodernijim igrama kakav je, recimo Crysis, a još uvek spada u jednu od najlepših igara koje se mogu igrati na PC platformi. Mi smo testirali na najvišem mogućem nivou detalja, u DirectX 10.0 režimu, bez patch-a za DirectX 10.1 i narednog, koji ga je poništio.
Crysis 1.1 Benchmark
Šta reći o najdetaljnijoj, grafički najimpresivnijoj igri i najzahtevnijoj igri današnjice. U odnosu na Call of Duty 4 ili bilo koju drugu igru koja vam može pasti na pamet – Crysis je bar za dva koplja iznad. Čak i na GeForce GTX280 karticama i Quad Core mašinama, prosečan frame-rate iznosi tridesetak frejmova po sekundi, u iole višim rezolucijama. Mi smo testirali kroz standardni GPU benchmark i to uz trik koji nam omogućava da “DX10-only” efekte vidimo i u DX9 okruženju, ali smo koristili naš custom .ini fajl koji omogućava još veću daljinu iscrtavanja (slično smo ranije radili i sa FarCry igrom), veći broj dinamičkih osvetljenja i senki, precizniji enviroinment mapping i refleksije… Najbolji opis grafičkog nivoa ove igre na ovakvom nivou detalja, koji je u odnosu na Very High za jedan stepenik iznad, zvuči otprilike ovako: koliko je FarCry tehnički ispred prvog Quake-a, toliko je Crysis ispred svog pomenutog prethodnika.
Half Life 2: Episode Two
Treća epizoda Half Life 2 priče, odnosno četvrto poglavlje priče o “Frimenu protiv korumpiranih vanzemaljaca”. Source Engine je bolji nego ikad, ali se već vidi da počinje da gubi korak sa Unreal 3, a pogotovo Crytek tehnologijom. No, poslednji build ipak ima svoje lepe osobine: broj pixel shader efekata je veći, a teksture i objekti su detaljniji. Na pravi način su dodati i efekti poput motion blur i depth of field-a, novi particle sistem omogućava bolje efekte varnica i vatre, a sistem osvetljenja i senčenja je realniji (dostigao je nivo igre Doom 3 i Quake 4). Alpha teksture (ograda, trava, drveće, šine) kojih ima u velikim količinama, sada imaju obavezno napredno filtriranje, pa izgledaju znatno bolje u odnosu na iste iz prethodnih epizoda. I fizika je znatno poboljšana, mada u ovom aspektu ni inicijalni Half Life 2 nije zaostajao. Druga epizoda donosi i multi-core podršku, a sama igra je jako dobro optimizovana.
F.E.A.R 1.08
Ova fantastična, grafički impresivna i veoma zahtevna horror igra je dobila zasluženo mesto u našem test batch-u. Testirali smo u “ugrađenom” walkpath demou, koji ispisuje prosečan broj frejmova. Naravno, sve moguće opcije vezane za grafiku, fiziku i zvuk smo stavili na maksimum – sve osim mekih senki, koje ne rade sa antialiasingom.
S.T.A.L.K.E.R
Ova pomalo bagovita igra, nakon dugog perioda razvoja, stiže na PC mašine širom sveta. Neke je razočarala, ali je činjenica da predsavlja popriličan stres za mašinu, a pogotovo grafičku karticu. Koristi napredne Shader Model 3.0 “efekte”, ali se izrazito oslanja i na klasičan multitexturing i fiksne funkcije (nije ni čudo, jer je razvoj na igri počeo kada je DirectX 7 bio aktuelan). Mi smo tesitrali sa maksimalnim nivoom detalja dostupnim iz same igre. Testiranje obavljamo fraps-om, nakon čega dajemo prosečan framerate tokom prvih 30 sekundi trčanja, a test lokacija je deo mape sa samog početka igre.
The Elder Scrolls IV: Oblivion
O ovoj igri zaista ne treba mnogo pisati, jer je u pitanju ne samo najbolja RPG igra iz prvog lica i dostojni naslednik prethodnih igara TES serijala, već i grafički revolucionaran naslov. Oslonjen na poslednju verziju Gamebryo engine-a (koji koriste i mnoge druge igre – Sid Meier's Pirates!, Civilization IV, Dark Age of Camelot itd.), Oblivion je sposoban da prikaže ogromna prostranstva prepunu bogatom florom i faunom uz nezapamćeno visok nivo detalja. Igra podržava i Havok engine za kalkulaciju fizike (nažalost, za sada samo od strane CPU-a). Zbog tehnike na koju su Bethesdi ponosni, SpeedTree, koja svaki put drugačije generiše raspored drveća i manjih stena, benchmark-ovanje u ovoj igri je pomalo nekonzistentno, te zahteva veći broj ponavljanja. Mi smo se odlučili za merenje performansi unutar veoma guste šume, u kojoj prolazimo između dva Eyelid-a (podzemne prostorije drevne civilizacije) na konju, sve posmatrajući iz prvog lica (postoji i mogućnost igranja iz trećeg lica). Svaka od tri vožnje je merena Fraps-om, zabeleženi su srednji rezultati, a onda je dat prosek. Naravno, koristili smo najviši nivo detalja koji je moguće postići iz same igre (bez self-shadows, koje nisu lepo rešeni), uključujući i HDR+AA, gde je to moguće.
Need For Speed: Carbon
A za sve ljubitelje Need For Speed serijala, evo i rezultata iz prethodnog nastavka ove popularne franšize koji nosi podnaslov – Carbon. Igra je inicijalno razvijana za Xbox360 i znatno je grafički poboljšana u odnosu na Most Wanted (mnogima se doduše ne sviđa motion blur); teksture su detaljnije, broj objekata koji su animirani znatno veći, AI NPC-ova je bolji, a broj poligona je tri puta viši uz bolje efekte. Tu su i neki lepi noviteti kao što je DOF, HDR i poneka paralax occlusion mapa… Pogledajmo rezultate iz verzije 1.2.
Need For Speed: ProStreet
Još jedan naslov iz neizbežnog Need For Speed serijala, koji koristi unapređeni “engine”, specijalno razvijan za Xbox360 i SonyPlaystation 3, a onda i portovana za PC platformu. Nije mnogo zahtevnija od prethodnika, a iako se to ne može odmah primetiti, znatno je grafički poboljšana u odnosu na njega. Modeli automobila i okolinih objekata su značajno bolji, sa više poligona i detaljnijim teksturama. Omraženi, lažni motion blur iz Carbon-a je izbačen, a dodat je daleko suptilniji efekat dinamički primenjenog blura; teksture su detaljnije, broj animiranih objekata znatno veći, a particle efekti, a posebno dim, značajno su upečatljiviji. Depth of Field i HDR su standardna pojava, a dizajneri igre tvrde i da su oblaci volumetrijski.
Overclocking
Naša test kartica je, uzevši u obzir i uslove u kojima je testirana (malo kućište), kao i to da se radi o dual-GPU rešenju, bila prilično raspoložena za dodatno ubrzanje. GPU smo mogli da ubrzamo za 45MHz, bez gubitka stabilnosti, iako smo u startu mislili da će i 815 MHz biti sasvim u redu. Međutim, krajnji rezultat je 795 MHz za GPU, što bi verovatno i ostalo na nekih 805 do 810 MHz, da je kartica testirana van kućišta (klima uređaj je bio uključen tokom čitave test sesije). Memoriju je bilo moguće ubrzati za oko 70 MHz, što u prevodu znači 3880 MHz i dosta je manje od Radeon HD4870 modela. Dakle, finalni “klok” iznosi 795 / 3380 MHz, što zapravo i nije toliko loše, pa možemo da prikažemo i rezultate:
Zaključak
Performanse koje pruža AMD Radeon HD4870X2 akcelerator smo mogli da anticipiramo i ranije, ali smo ipak bili oduševljeni kada smo ga stvarno testirali. U suštini, to i dalje jesu dve kartice u jednoj, ali ona svakako staje u jedan PCI Express x16 slot i njoj može da se pridruži i još jedna u CrossfireX „niz“, kada možete imati četiri GPU-a u sistemu, ali i četiri gigabajta video memorije. To vam svakako ne bi pošlo za rukom da ne postoji Radeon HD4870X2, zar ne? Još jedna prednost koju konkretan X2 model ima u odnosu na Radeon HD4870 leži u činjenici da je gotovo nezamenjiv za korisnike Intel čipsetova, koji u Crossfire modu i dalje imaju dva PCI Express x16 slota koja rade u 8x režimu. Sa HD4870X2 karticom sistem komunicira uz punih 16 linija, a i sama dva grafička čipa imaju dosta ubrzanu međusobnu komunikaciju. Svakako je logično da uz ovakav akcelerator imate neki od jačih modela četvorojezgarnih procesora na frekvenciji od bar 3.5 GHz, jer će u suprotnom, sistem limitirati performanse grafičkog akceleratora sve do rezolucije 1600 x 1200 (naravno, ne u svim igrama). Na našim testovima, Radeon HD4870X2 se pokazao kao ubedljivo najbrži, a posebno nas je obradovalo to što smo videli da je X2 model značajno brži od single GPU verzije RV770 kartice, što znači da je problem sa skaliranjem sveden na sam minimum. Dodatna sideport logika na čipovima svakako pokazuje svoje prednosti, jer se pokazalo i da je, u određenim situacijama, Radeon HD4870X2 i za nijansu brži od dve posebne Radeon HD4870 kartice.Međutim, AMD je posebno ponosan i na činjenicu da sada, a verovatno i u mesecima koji su pred nama, ima apsolutnog tehnološkog lidera i najbržu karticu na svetu. Radeon HD4870X2 jeste brži od direktnog konkurenta, GeForce GTX280 monstruma, koji se, bar po prodajnim rezultatima, nije preterano proslavio. Ruku na srce, najjači GT200 jeste jako brza kartica, ali je Radeon HD4870X2 još brži i to najčešće za više od 15%, što je veliki uspeh za AMD.
Radeon HD4870X2, kao i svaka MultiGPU kartica, ima svojih mana. I ovoga puta, realna količina memorije je dva puta manja od one koja je prisutna, pa je sva sreća što je ta količina fantastičnih 1024 MB. Problemi sa skaliranjem još uvek postoje u pojedinim naslovima, ali ih je sve manje. Ipak, nikad ne možemo biti sigurni kako će se ovakve kartice ponašati u tek predstavljenim igrama, ali čak i tada – neko vreme možete računati na sasvim dobre performanse single Radeona HD4870. Iako se desi da sačekate nekoliko dana na patch ili workaround hack, setite se da HD4870X2 nije namenjena običnom bezbrižnom igraču koji će samo da klikne na ikonicu i igra igru, već na onog koji će da se bar malo (a često i malo više) potrudi da iz svog hardvera, a i same igre, izvuče maksimum u svakom smislu. Još jedna od potencijalnih mana ove vrhunske komadine hardvera leži u činjenici da ona definitivno traži prostrano kućište i, što je još važnije, dobro sistemsko napajanje. Neki minimum je 650W, ali bi mi preporučili oko 800W, jer ceo sistem, pod opterećenjem, ume konstantno da vuče oko 480-500W, što svakako nije malo. Iako ovakvoj kartici ne možemo mnogo zamerati na količini toplotne energije koju disipira, ipak moramo skrenuti pažnju na to da je ona zaista vrela i da joj svakako morate obezbediti prostrano i veoma dobro provetreno kućište, kako bi što manje zagrevala ostale komponente. Za očekivati i jeste da kupci koji će dati više od 400 evra za grafičku karticu već imaju sve ove preduslove, pa tako i iskazane mane u realnosti dosta gube na težini.
Na stranim tržištima, Radeon HD4870X2 košta oko 100 dolara više od GeForce GTX280 kartice, koja je sa frapantnih, početnih 650 “pala” na 450, a često i svega 400-ak dolara (e-mail rebate). Na našem tržištu, obe kartice koštaju oko 450 evra, ali GTX280, koji je već neko vreme na tržištu, ima cenu sa tendencijom opadanja. I dok će Radeon HD4870X2, kartica sa dva gigabajta najbrže GDDR5 memorije teško moći da “isprati” ovaj trend, mi ćemo samo napomenuti da je njena trenutna cena prilično dobro odmerena. U pitanju je fascinantno brz grafički akcelerator koji vam omogućava sulud nivo detalja u ultra-visokim rezolucijama uz i dalje igriv framerate. Ako ste ikada probali da na vašem sistemu igrate Crysis u običnih 1440 x 900 piksela, ali sa maksimalnim nivoom detalja, videli ste koliko je to zahtevna (i lepa) igra. Radeon HD4870X2 bi, tako, omogućio da igru igrate u 1920 x 1200, uz maksimalan antialiasing i anisotropic pride. To je iskustvo koje morate doživeti, ali je za njega potrebno i da adekvatno platite.
Kao što nije imala adekvatan odgovor na Radeon HD4870, NVIDIA tako i sada nema odgovor na HD4870X2. Naravno, Chipzilla sada može da se fokusira na neke druge stvari (CUDA, PhysX i sl.), ali dok se ne pojavi revizija GT200 čipa u 55-nm litografiji i dok ne izađe GeForce GX2800 (ili GX2280), Radeon HD4870X2 će biti na tronu, a AMD može da se fokusira na povećanje marketshare-a (nadamo se da će jedan od načina za to biti i dalje usavršavanje drajvera). Još jedan problem za konkurenciju može biti Radeon HD4850X2, za koga je realno da će ponuditi performanse koje su i dalje bolje od GTX280 modela, a koji od najjače “X-dvojke” košta čak 150 dolara manje! Kako je na AMD Radeon HD4870X2 karticu teško ostati ravnodušan, ovaj 2.4 TeraFLOPS monstrum sa 1600 streaming shader jedinica i 2 GB GDDR5 video memorije od nas dobija Benchmark Editor’s Choice Award.
AMD Radeon HD4870X2 – Benchmark
Editor's Choice Award
AMD Radeon HD4870X2 karticu na test ustupio AMD.