Branko Maksimović
AMD Radeon HD5970
Jasno je da nije svaki igrač spreman da odvoji preko 300 evra za grafičku karticu, ali i da postoji određen broj njih kojima ni dvostruko veća cifra ne predstavlja problem. Najbrži SingleGPU video akcelerator iz AMD-a, nakon blažeg overkloka procesing moć od čak tri TeraFLOPS-a, što trenutno parira teorijskoj “snazi” čak tri najjače NVIDIA Tesla kartice zajedno. No, AMD je još uvek fokusiran uglavnom na gaming i nedavno predstavljen Radeon HD5770 je svakako poslužio da se DirectX 11 spusti “u mase”, a to je osnovni preduslov da izdavači konačno na tržište puste prve igre koje koriste benefite nove verzije Microsoft-ovog “igračkog” API-ja. Prve igre, demo i benchmark programi sa “prirodnom” podrškom za DirectX 11 su se već pojavili (Unigine, CMR Dirt 2 Demo), a DirectX 11 akceleratori su dostupni i po cenama koje su manje od 150 evra. Radeon HD5770, kao što smo saznali u prethodnom testu, poseduje oko milion tranzistora, ali je izrađen u 40-nm procesu i praktično predstavlja derivat Cypress tehnologije. Po “snazi” je u rangu sa RV870, odnosno Radeon HD4890 GPU-om, s tim što sa video memorijom komunicira putem 128-bitne magistrale, što je, kao i ranije sa Radeonom HD4770, donekle kompenzovano višim radnim učestanostima. Radeon HD5700 GPU je takođe proizveden u 40-nanometarskom procesu, baš kao i pripadnik prethodne generacije, RV770 – Radeon HD4770, koji je i jedini čip iz prethodne, DirectX 10.1 serije, koji je izrađen u ovom procesu, a istovremeno je i prvi GPU sa kojim se AMD “prebacio” na sitniju litografiju. Juniper se sastoji od oko 1.04 milijarde tranzistora, što je više od 50% manje u odnosu na 2.15 miliona ovih osnovnih poluprovodničkih elemenata, koliko ih ima kod Cypress jezgra. Istovremeno, ova cifra je i nešto veća od 956 miliona tranzistora kod RV770 GPU-a (Radeon HD4890), koji je izrađen u 55-nm procesu. Svakako, usvajanje novijeg Shader Modela i dodatne optimizacije na nivou keš memorije i SIMD jedinica su učinile da GPU koji ima sličnu “snagu”, bude, mereno sirovim brojem tranzistora, nešto kompleksniji, bez obzira na to što čak ima i dva puta manji broj memorijskih kontrolera. Juniper izgleda kao jedna polovina Cypress-a, što se čak prenelo i na memorijski kontroler. Dakle, sada je tu 800 streaming procesora, unutar istih SIMD jedinica, kojih je sada deset u jezgru. O ovim SIMD jezgrima više informacija možete saznati na prethodnoj stranici. Kao i kod Radeon HD4890, HD4870 i HD4850 grafičkih procesora, Radeon HD5700 GPU poseduje 10 teksturnih jedinica, a “prepolovljen” je i render back-end, pa je broj ovih jedinica kod Juniper-a – 16, ali su one naprednije od 16 ROP-ova kod prethodne generacije (takođe savetujemo da pogledate prethodnu stranu). Memorijski kontroler se sastoji od dva crossbar dela, ili stanice, širine po 64-bita, što daje ukupnu širinu magistrale od 128 bita. Cypress poseduje četiri ovakva kontrolera. Radeon HD5770 je prva kartica sa Juniper GPU-om koju smo testirali, a po defaultu, grafički procesor, radi na 850 MHz, baš kao i kod modela Radeon HD4890, što daje compute moć od čak 1.36 TeraFLOPS-a. Impresivno je da ovaj mali “super kompjuter” sada može biti vaš za 150-ak evra! 1GB GDDR5 memorije bi trebalo da radi na 1200 MHz, a kako je GDDR5 praktično quad-data rate memorija, ova cifra pomnožena sa četiri daje efektivnh 4800 MHz, što je, upotrebićemo ponovo isti epitet – impresivna cifra. Doduše, brza memorija je sada vrlo dobrodošla, jer je magistrala dva puta uža, pa bi Radeon HD5770 mogli da posmatramo i kao karticu sa 256-bitnom magistralom i GDDR3 memorijom na efektivnih 2.4 GHz. Istini za volju, GDDR3 memorija ima nešto oštrije tajminge, ali to kod video kartica nije od tako presudnog značaja za performanse kao kod sistemske RAM memorije.
Kao što znamo – ovo je treći put da AMD primenjuje svoj već oprobani poslovno-tehnološki model. Pre dve godine, imali smo Radeon HD3800, a onda je stigao i HD4800 – druga, te treća generacija GDDR5 kartica. Uz njih je stigla i podrška za DirectX 10.1 i Shader Model 4.1. Sa jedne strane, AMD se posvetio optimizaciji i ubrzanju kompleksnije 3D grafike, a NVIDIA, donekle u ćorsokaku sa skupim i ne-modularnim GT200, okrenula se promociji ubrzanja fizike i zatvorenom GP-GPU standardu, koji naziva CUDA. NVIDIA Tesla kartice bazirane na GT200 čipu su poručivane za budžetske super-kompjutere, koji svakako nemaju loš odnos cene i performansi, ali se ne može reći da odgovaraju baš svim ustanovama, jer je optimizacija softvera i dalje nešto na šta većina uhodanih sistema ne želi da troši vreme i novac. Kada se pojavi Fermi (GF100), NVIDIA će ponovo podržavati i otvorene GP-GPU standarde (OpenCL), kao i one koji će verovatno biti brže podržani (DirectCompute 11) od strane programerskih zajednica svih tipova. Ako se prisetimo i činjenice da se grafički adapteri danas sve češće koriste i za akceleraciju general-purpose aplikacija, a ne samo grafike, jasno je da GPU kao takav postaje sve bitniji, jer će biti važan i korisnicima koji se uopšte ne igraju. Ono što je sigurno, jeste da ćemo u narednih par „sezona“ videti mnogo toga novog i uzbudljivog kada je grafika na računarima u pitanju. Ne može se reći da je NVIDIA u prethodnom periodu bila neuspešna, jer je bez žestokog ulaganja u R&D, uspela da povrati novac koji je uložen u razvoj GT200 i to na sasvim “desetoj” strani. Štaviše, prvi batch Fermi čipova će otići upravo u Tesla super-računare, koji su već poručeni od strane brojnih institucija i upravo zbog toga će DirectX 11 kompatibilni GeForce malo zakasniti na tržište.
Radeon HD4890 GPU je nekada impresionirao brojkama (RV790) – 959 miliona tranzistora, 800 stream jedinica organizovanih u okviru 10 SIMD klastera, 40 teksturnih jedinica, 16 render back-end unit-a – postao je sasvim običan kada se pojavio Cypress. Korisnici, koji su pratili i posmatrali koliko je svaka nova generacija Radeon akceleatora donela u odnosu na prethodnu, sada očekuju da se sirova snaga, bar ona na papiru, udvostruči. AMD i ATI ih svakako nisu razočarali, pa je RV870 zaista veliki i moćan čip koji čini da RV770 i RV790 izgledaju kao običan mainstream. U AMD-u jesu naveli kako smatraju da kreiranje monolitnog čipa više nema smisla i da će njihov GPU uvek biti pozicioniran da bude „srce“ performance serije kartica, baš kao što su to bili RV670 i RV770. Dalja strategija je da se prvo kreira ultra-high end klasa sa CrossFire –on-board modelom (HD5870X2), a onda i da se od RV870 čipa, napravi jednako pametna, ali manje mišićava verzija GPU-a, baš kao što je to i ranije bio slučaj. Ova strategija nema razloga da ne upali i treći put, a trenutno smo u njenoj drugoj trećoj fazi, jer je AMD upravo predstavio i najjači – DualGPU model – Radeon HD5970. Dakle, AMD je još jednom uspeo da stigne do cilja pre NVIDIA-e. Ovoga puta, konkurencija ne zaostaje malo – i, ako smo pre par sezona imali foto finiš, crveni tim je u poslednjoj trci bežao sa bar dva kruga prednosti…
Čitaoci kojima RV7xx arhitektura nije poznata bi ipak trebalo da pogledaju neki od narednih testova na ovoj ili ovoj lokaciji. Osim gore preporučena dva testa, predlažemo da pogledate i naše prethodne testove Radeon HD4800 familije (dodatni link – 1, 2, 3), a posebno Radeon HD4870X2 akceleratora, u kome je cela priča o DirectX 10 generaciji GPU-ova dopunjena i osvežena. Da vas ne bi upućivali i na to da gledate prethodni test, mi ćemo priču o AMD-ovom prvom DirectX 11 grafičkom procesoru prebaciti u kraću formu, ali je i dopuniti i osvežiti novim informacijama – pogotovo o onima koji se tiču novog „dvoglavog“ modela – Radeon HD5970, kartice sa kodnim nazivom Hemlock.
V8xx arhitektura…
Na ovoj stranici ćemo još jednom pomenuti sve novitete koje je doneo AMD-ov novi GPU, RV870, poznatiji kao Cypress, odnosno Radeon HD5800. Nakon ove, prilično dugačke html strane, prećićemo na novitete koje donosi Dual-Cypress, odnosno Hemlock!
Kao što znamo, Radeon HD4870 i HD4890 kartice su postale prilično jeftine u odnosu na ono koliko su koštale kad su se pojavile, a čip koji je nekada impresionirao brojkama (RV790) – 959 miliona tranzistora, 800 stream jedinica organizovanih u okviru 10 SIMD klastera, 40 teksturnih jedinica, 16 render back-end unit-a – postao je sasvim običan kada se pojavio Cypress. Korisnici, koji su pratili i posmatrali koliko je svaka nova generacija Radeon akceleatora donela u odnosu na prethodnu, sada očekuju da se sirova snaga, bar ona na papiru, udvostruči. AMD i ATI ih svakako nisu razočarali, pa je RV870 zaista veliki i moćan čip koji čini da RV770 i RV790 izgledaju kao običan mainstream. U AMD-u jesu naveli kako smatraju da kreiranje monolitnog čipa više nema smisla i da će njihov GPU uvek biti pozicioniran da bude „srce“ performance serije kartica, baš kao što su to bili RV670 i RV770. Dalja strategija je da se prvo kreira ultra-high end klasa sa CrossFire –on-board modelom (HD5870X2), a onda i da se od RV870 čipa, napravi jednako pametna, ali manje mišićava verzija GPU-a, baš kao što je to i ranije bio slučaj. Ova strategija nema razloga da ne upali i treći put, a trenutno smo u njenoj drugoj fazi. Ostaje samo da vidimo kako će „proći“ priča sa Radeon HD5870X2 modelom.
Evergreen tehnologija – još jednom!
Na ovoj stranici ćemo još jednom pomenuti sve novitete koje je doneo AMD-ov novi GPU, RV870, poznatiji kao Cypress, odnosno Radeon HD5800. Nakon ove, prilično dugačke html strane, prećićemo na razlike koje su karakteristične za Juniper – novi, manji GPU namenjen za Radeon HD5700 seriju kartica…
Kao što smo rekli, AMD je radio na unapređenju arhitekture, ali i sirove snage svog novog grafičkog procesora, ali je i on i dalje baziran na tradicionalnom tipu GPU „pipeline-a“, pa su tu ponovo streaming, render-back end iteksturne jedinice. Međutim, nas zanima kakve su novine vezane za unapređenje arhitekture i koliko je i kako poboljšan feature set i šta to konkretno znači za industriju i krajnjeg korisnika. Šta nam to novo donosi DirectX i DirectCompute 11, Shader Model 5.0, novi hardware tesselator i sistem senčenja, algoritam za kompresiju HDR slika,da li nam je potrebno da igre igramo u ultra-visokim rezolucijama na više monitora. Ono što znamo je da je AMD uspeo da udvostruči raw computing power u odnosu na prethodnu generaciju, ali da je zadržana 256-bitna memorijska magistrala. Svakako, broj RBE, TMU i stream jedinica je povećan, a ono što je novo je i podrška za rad na čak šest monitora na jednoj kartici. Ili na dvanaest, ako imate Crossfire, odnosno osamnaest ako imate Tripple CrossFire. Slobodno izračunajte šta bi bilo ako bi u sistem uspeli da „smestite“ četiri Radeon HD5870 akceleratora. Ruku na srce, za ovakve poduhvate će vam, osim mnogo prostora za monitore i šumu kablova iza, biti potrebna i Eyefinity verzija HD5870 kartice, ali o tome nešto kasnije.
RV870, Evergreen, grafički procesor sadrži oko 2.15 milijardi tranzistora. Setili smo se da smo tek nedavno bili fascinirani sa 956 miliona ovih osnovnih poluprovodničkih elemenata, koliko ih ima unutar Radeon HD4890 GPU-a (RV790). Sirova computing moć novog GPU-a, na Cypress karticama (Radeon HD5870) je više od 2.7 TeraFLOPS-a, a isto tako smo se, pre manje od godinu dana, oduševljavali što prethodna generacija uspeva da “prebaci” jedan TeraFLOPS. RV870 je prvi DirectX 11 GPU, prvi veliki grafički procesor izrađen u 40-nm, zbog čega je AMD uspeo da udvostruči efektivnu snagu procesora, a da ostane u istim okvirima potrošnje i zagrevanja kao kod prethodne generacije. Ovo im omogućava da ponovo primene Sweet Spot strategiju – nakon što se kreira GPU za performance segment, ultra-high end klasa kartica realizuje se sa Dual GPU modelom (HD5870X2), a onda se radi derivat postojećeg GPU-a sa manje streaming jedinica, te manjim TMU, RBE i cache blokovima – RV830 ili RV840 (koji će možda biti nazvani Radeon HD5700 ili HD5600). Iako je AMD naveo da više neće proizvoditi veliki monolitni GPU, kako nazvati procesor koji ima 2.15 milijardi tranzistora? Svakako, ovo nije toliko velik GPU, jer je izrađen u 40-nm procesu. S druge strane, njegova površina jeste veća od prethodnika, izrađenog u 65-nm litografiji. Izgleda da proces izrade ne može da napreduje toliko brzo kao apetiti i želje dizajnera GPU-a i tempa samog tržišta, a znamo da je potrebno ostati u vrhu.
RV870 se proizvodi u pogonima tajvanske kompanije TSMC u 40-nm procesu i, kao što smo naveli, sastoji se od približno 2.15 milijardi tranzistora, a njegova površina je 334 kvadratna milimetra, što nije mnogo, s obzirom na to da su RV770 i 55-nm G92 (G92b) negde oko 250-260 mm2, a znamo da su u pitanju GPU-ovi koji pripadaju performance, a ne high-end segmentu. Poređenja radi, GT200, koji ima 1.4 milijardu tranzistora, ima površinu od čak 576 mm2, dok se za GT200b smatra da je tek nešto ispod 500 kvadratnih milimetara.
Organizacija GPU-a
Front-end RV870 / Cypress čipa je prilično tradicionalan – AMD ga naziva Graphics Engine, što je bolje od našeg termina „pipeline“, koji je gotovo pogrešan, ali nam se uvukao u rečnik iz nekih prethodnih vremena. Sve kreće od Command Processor dela, koji je u samom komandnom vrhu, nakon čega slede standardne faze Graphics Engine-a koje možemo podeliti u Rasterizer, Hierarchical Z, Tesselator itd. baš kao i u prethodnim generacijama. Svaka od ovih jedinica je unapređena, sa akcentom na Tesselator, a Rasterizer i Hierarchical Z su toliko pojačani, da je AMD odlučio da ih dva puta prikaže na svom dijagramu. Štaviše, u zvaničnim dokumentima se i navodi da u GPU-u postoji dodatni Rasterizer kako bi se prvi rasteretio u situacijama u kojima bi veliki broj poligona mogao da zaguši ovu jedinicu dok radi na deljenju istih na teksele (koji će posle transformacije postati pikseli). Upošljavanje dodatne Rasterizer jedinice i adekvatan load balancing se vrši hardverski, unutar samog čipa i ne zavisi od komandi poslatih od strane drajvera. Osim Ultra Threaded Dispatch jedinice koju smo imali i u prethodnoj generaciji, GPU sada ima i Geometry Assembly Unit koji, između ostalog, može da adekvatno hrani computing jedinice i „pomaže“ Dispatch Unit-u u load balancing-u.
Tesselation je priča koju ATI pažljivo razvija još od Radeona 9700, koji je bio aktuelan pre više od sedam godina! Danas je ova mogućnost podržana i standardizovana od strane API-ja. Šira upotreba ove jedinice u igrama je krenula uz popularizaciju Xenos GPU-a unutar Xbox360 konzole. Unapređena Tesselator jedinica je je poseban deo RV870 grafičkog čipa koja obogaćuje low-poly 3D modele posebnim matematičkim algoritmima, u high-poly modele i to bez opterećenja na glavni computing deo GPU-a. Algoritam, preveden u hardver i dalje koristi usavršenu verziju matematičkog modela kakav je i ranije postojao, a koji se oslanja na higher-order surfaces princip, o kome smo baš na ovom sajtu pisali više puta, pre dve, pet i više godina (setimo se različitih metoda – N-Patches, Bezier patches, displacement maps). Uz DirectX 11, čitava priča je dobila na težini, jer se sada Tesselator jedinica koristi za programiranje putem dva tipa šejdera, a to su hull shaders i domain shaders. Algoritme koji se već koriste u DirectX 9 i 10 generaciji cross-platform igara kakve su one bazirane na Unreal 3 engine naslovima (Catmull Clark algoritam), Tesselator unutar RV870 jezgra može da odradi u jednom prolazu, iako ceo princip deljenja (tesselation) podrazumeva povećanje složenosti modela korak-po-korak. S obzirom da je algoritam kakav smo pomenuli multi-threadovan unutar modernog Radeon GPU-a, jasno je da se više koraka prilikom pripreme modela može podeliti na više sub-unit-a (koje su zapravo specijalizovane ALU jednice) unutar Tesselatora, tako da se ceo postupak odradi u jednom prolazu čak i za veliki broj modela. Ako su modeli unutar igre međusobno isti, Tesselator naravno može da sarađuje i sa Geometry Instancing sistemom, koji postoji i kod Cypress GPU-a, a koji je ATI prvi put predstavio na istom revolucionarnom GPU-u (R300, Radeon 9700). Geometry Instancing je podržan i kroz DirectX API još od verzije 9.0.
Valjalo bi napomenuti i da se nivo do kog će Tesselator usložnjavati modele može odrediti hardverski, unutar samog GPU-a, ali i kontrolisati od strane aplikacije, direktnim input-om na API, kako bi se kontrolisale performanse. Moćan Tesselator Unit će omogućiti da igre, bez bitnog učešća od strane dizajnera, imaju znatno detaljnije modele objekata, teren, pa i površine kakva je voda.
Još napredniji Shader
Ako pogledajmo sada osnovne karakteristike RV870 GPU-a.
Primetićemo da isti poseduje prilično veliki broj tranzistora – više od dva puta veći broj u odnosu na RV790, a pogotovo RV770 (koji ih ima još manje zbog nedostatka Decap Ring-a koji je omogućavao da RV790 postigne više radne učestanosti). Naravno, i broj shader, odnosno streaming procesor jedinica je udvostručen, ali i broj TMU i RBE unit-a. Svakako, memorijska magistrala je ostala ista, ali višak tranzistora je upotrebljen na dodatne, DirectX 11 specijalizovane jedinice, dodatne Rasterizer i Hierarchical Z jedinice, pojačani Tesselator… upravo zbog toga je RV870 toliko masivniji GPU. Osim udvostručenog broja computing jedinica unutar jednog GPU-a, AMD je i dodatno unapredio gotovo svaku od njih i to u domenu performansi po kloku, ali i preciznosti (što se najviše odnosi na stream processing jedinice). Neka od tih unapređenja su bila neophodna da bi se omogućila komplementarnost sa DirectX 11 API-jem u samom harderu, a neke je AMD uveo zbog performansi, uštede i bolje optimizacije i efikasnosti.
Pogledajmo pojednostavljeni grafički prikaz čipa. Po njemu bi se moglo reći da je RV770 samo dupliran, jer postoje dva bloka sa po deset SIMD jedinica, baš kao da je svaki taj veliki blok iz RV770 iskopiran na dva mesta u GPU-u. I naša priča o tome kako sada postoje dva Hierarchical Z i Rasterizer dela čipa govore u prilog toj “teoriji”. Dakle, Cypress ima 20 SIMD blokova, a u svakom se vidi po 16 thread processors unit-a i unutar svakog od nih pet aritmetičkih jedinica. Po AMD-ovom kalkulatoru, 20 x 16 x 5 = 1600, pa je tako navedeno da RV870 ima 1600 streaming processors jedinica. NVIDIA bi možda ovo objasnila drugačije – GPU ima 320 shader jedinica, ali je svaka od njih 5-way. U svakom slučaju, i dalje se radi o ALU jedinicama koje rade sa skalarnim operacijama, uz poseban translator koji vektorske instrukcije prevodi u nedimenzionalne, skalarne. Organizacija SIMD (Single Instruction Multiple Data) jedinica je, zapravo, jako slična organizaciji kod prethodnih generacija i u biti se nije promenila još od Radeona HD2900. Unutar svakog SIMD bloka postoji primarna izvršna jedinica superskalarnog tipa koja poseduje pet aritmetičko logičkih podjedinica (ALU-ova) sposobnih za po jednu MAD (multiply-add) instrukciju po ciklusu u 32-bitnom FP formatu. Od tih pet jedinica, jedna je zadužena i za transcendentne matematičke operacije (sin, cos, log, exp). Izvršne jedinice su povezane sa drugim takvim jedinicama unutar susednih SIMD-ova (uz osam obaveznih ciklusa kašnjenja, koji su „prepleteni“ pa je efektivna latencija svega četiri ciklusa). Ovde se ne misli na kašnjenje informacija koje SIMD-ovi dele, već o toku izvršavanja thread(ova) kroz streaming / shader deo GPU-a. Ako četiri ciklusa „latencije“ pomnožimo sa ALU „širinom“ svakog SIMD-a, dobićemo cifru od 64, što je upravo cifra o kojoj smo pričali kada smo objašnjavali arhitekturu Radeon HD2900XT akceleratora i koliko je bitno što je branching sada moguće podeliti na 64 piksela ili delova thread-a radi veće preciznosti i višeg „kvaliteta“ output-a.
Drugim rečima, SIMD jedinica je kontrolisana putem VLIW (very long instruction word) komande, koja može da obuhvati šest instukcija – pet matematičkih i jednu branching instrukciju. Ova komanda, VLIW kontroliše čitav SIMD blok ALU jedinica, koje rade na istom ili srodnom thread-u u datom trenutku. SIMD jedinice izvršavaju svaki thread paralelno i to na više elementarnih nivoa (5 matematičkih operacija uz obavezan flow control. Unutar svakog shader programa postoji specijalna instrukcija koja kontroliše, odnosno opisuje kako bi kod trebalo da se izvrši pod određenim (važećim) uslovima. Niz ovih instrukcija kroz nekoliko povezanih ili jedan (veći) shader program se zajedno nazivaju – flow control. Zahvaljujući preciznom Dispatch Processoru i već pomenutim arbitrima, sve operacije unutar jednog thread-a se izvršavaju paralelno kroz celu SIMD jedinicu, uz napomenu da se Texture i Vertex Fetch operacije prosleđuju i izvršavaju odvojeno.
Iako smo ovaj deo teksta mogli gotovo da prekopiramo iz dve i po godine starog teksta o Radeon HD2900XT akceleratoru, neke stvari su kod RV870 značajno unapređene, ali ih je veoma teško opisati rečima, a mi ne želimo da prenosimo matematičke formule i primere koda koje bi uskom delu čitalaca mogle da objasne kakva su poboljšanja postignuta na GPU compute nivou, a sve zbog povećanja efikasnosti ALU jedinica uopšte, ali i u radu sa tipskim shader programima. AMD navodi da je instrukcioni set DirectX 11, DirectCompute 11 i OpenCL-a praktično potpuno implementiran u hardveru RV870 čipa. Ono što je konkretno poboljšano unutar svakog od SIMD blokova, a da je lako preneti “na papir” je i lokalna short-term bafer memorija koja se koristi za internu komunikaciju, a koja je sada duplirana i iznosi 32KB, a memory export buffer je povećan na 64KB, što znači da je dva puta efikasniji od istog kod RV770 (prosleđuje i do 64 32-bitne obrađene paket-instrukcije po kloku). Uostalom, u tabeli ste već mogli da vidite da je maksimalna processing moć RV870 GPU-a na Radeon HD5870 kartici čitavih 2.7 TeraFLOPS-a što je dva puta više od onog što nudi GeForce GTX 285 akcelerator. Ono što je još specifično za RV870 je da su kod ovog GPU-a prvi put izostavljene tradicionalne jedinice za interpolaciju unutar setup engine-a, čiju funkcionalnost sada preuzima shader procesor. Naime, ove funkcije su sada objedinjene unutar DirectX 11 kao jedan od njegovih feature-a i nazivaju se pull-model interpolation. Osim uštede u “tranzistorima”, ovaj deo sada i nema fiksnu funkciju i prilično je programabilan, što omogućava veću kontrolu nad funkcijama interpolacije tj. prikaza 3D površina sve do nivoa kontrole prikaza tekstura i filtriranja istih! Pored toga, interpolacija unutar posebne jedinice je u nekim situacijama postajala korak koji je usporavao i bio usko grlo u pripremi scene, a novi programabilni pull-model koji se oslanja na shader sada je dosta bolje izbalansiran (više se koristi u teksturno intenzivnim scenama koje imaju manje vertex operacija, odnosno manje u scenama sa manje tekstura i više “geometrije”), a s obzirom na daleko veću computing moć shader dela GPU-a, jasno je da će i na ovom polju, RV870 biti, klok za klok, efikasniji od prethodne generacije.
Radeon HD5870, Cypress GPU podržava i jednu instrukciju u svom hardveru, koju trenutno ne koristi ni DirectX 11, a ni OpenCL, ali može biti vrlo korisna u komunikaciji na nivou kompajlera i prevodioca, ako se dobro implementira u drajverima. U pitanju je SAD instrukcija (Sum of Absolute Differences), koja bi mogla da se koristi pri enkodingu video sadržaja i rada sa sličnim setom instrukcija tj. susednim setovima thread-ova koji se međusobno malo razlikuju (a takvi su vrlo česti). Prilikom enkodovanja HD videa, RV770 emulira SAD instrukciju putem deset do petnaest posebnih instrukcija, koje se ponavljaju u svakom sledećem koraku. Hardverski implementirana SAD instrukcija znači da se ona može obaviti u jednom klok ciklusu, što može da omogući i enkoding video materijala rezolucije četiri puta veće od FullHD-a, samo kad se implementira unutar drajvera. SAD se, kao što smo naveli, može iskoristiti kao zamena za različite tipske instrukcije prilikom rada sa kompajlerom, pa je moguće da ćemo videti značajnija ubrzanja kroz drajvere u narednim mesecima.
TMU i memorijski kontroler
Toliko povećanje SIMD, odnosno shader computing dela učinilo je da pristup memoriji kakav je bio prisutan od RV670, mora da se promeni. Količina L1 keš memorije sada iznosi 160KB (8KB po SIMD-u), uz više od 1TB/s propusnog opsega koje su na raspolaganju za L1 texture fetching, ačetiri zasebne L2 keš stanice, sada svaka sa 128, umesto 64 KB (sa bandwidth-om od 435 GB/s prema L1), nalaze se na svakom od memorijskih kontrolera pri render back-end-u. RV870 i dalje ima četiri 64-bitna memorijska kontrolera, što ukupno daje 256 bita za put ka video memoriji i to je jedini deo GPU-a koji je u odnosu na prethodnika nepromenjen. Propusni opseg je, doduše, u odnosu na Radeon HD4870 povećan za oko 40% (sa 3.6 GB/s na 4.8 GB/s), ali bi voleli da se AMD ipak odlučio za 128 bita širu magistralu, jer je ostatak GPU-a “pojačan” u svakom smislu za 100%, pa je moguće da će u visokim rezolucijama upravo širina memorijske magistrale predstavljati, bar u nekoj meri, usko grlo. Nismo sigurni da će se u skorije vreme pojaviti drastično brži GDDR5 čipovi koji bi mogli efektivan bandwidth da povećaju za 100% u odnosu na prethodnu generaciju, ali AMD je smatrao da bi bilo isuviše skupo ići na proširenje širine memorijskog kontrolera najpre jer bi to dodatno zakomplikovalo sam PCB. To bi, kao rezultat, verovatno onemogućilo da najbrža izdanja sa ovim čipom koštaju manje od 350 dolara, a verovatno bi se stvorio problem i sa “X2” varijantom koja je kod ATI-ja uvek bila Single PCB solucija, a koja bi u tom slučaju bila previše dugačka za smeštanje u obična kućišta. S druge strane, AMD tvrdi da je napravljen još jedan korak u daljoj optimizaciji potrošnje resursa koji GPU ima prema memorijskom podsistemu.
Osim algoritama koji su i ranije bili prisutni, sada je tu i block texture compression mod koji je AMD osmislio i predložio da bude uključen u DirectX 11 specifikaciju. Ovaj algoritam podrazumeva efikasniju kompresiju, brži rad i viši kvalitet nakon rekompresije u odnosu na prethodna rešenja (bolji rad sa alfa-kanalima, transparentnim i FP16 HDR slikama, bolji signal-to-noise odnos, itd.), pa je sada moguća kompresija i u odnosu od 6 : 1 i to za teksture koje su prilično velike (čak 16.000 x 16.000 piksela).
Osim sistema za kompresiju, AMD je dodatno poradio na kvalitetu anizotropnog filtriranja, što nije bilo toliko komplikovano kao što izgleda, s obzirom na to da smo već pomenuli kako je ova specijalizovana jedinica sada izbačena iz GPU-a i dodeljena, kao programabilna funkcija, u sam compute-shader deo GPU-a (streaming jedinice). AMD tvrdi da je novi algoritam jednako dobar kao referentni, emulirani Direct3D rasterizer, ali, naravno, neuporedivo efikasniji, jer nije ništa sporiji u odnosu na rešenje iz prethodne generacije. U ovom trenutku, dakle, AMD poseduje rešenje koje je bolje od konkurentskog, čak i kada se u ForceWare drajverima primeni high quality filtering. Čak i za običan trilinear filtering mod, AMD sada primenjuje full -true trilinear bez primene blending-a koji je uvek bio uključen, kako bi se aproksimacija prethodnih, manje preciznih (tzv. adaptive trilinear) metoda, koje su se koristile radi boljih performansi, manje videla u igrama. Kako se sada ova operacija obavlja unutar shader jedinica, AMD je odlučio da poveća kvalitet prikaza i na tome im skidamo kapu. Zadržavanje adaptive trilinear metoda bi možda dodatno povećalo performanse (i dalje ga je moguće aktivirati u drajverima), ali je podrazumevano (default) podešavanje – full trilinear.
Render Back End, Tesselator, Display Controler, PowerPlay…
Jedinica koja se nalazi “na kraju” rendering endžina, popularni ROP (raster operator) ili render back-end je takođe doživeo dosta poboljšanja. Osim što je dvostruko veći, pa ima 32 jedinice, svaka od njih sada ima i nove mogućnosti. Poseban deo je dodat za poboljšan rad sa custom-filtered AA sempl modovima umekšavanja ivica na objektima, jer omogućava teksturnim jedinicama da direktno pristupaju i čitaju podatke iz specijalizovanih bafer memorija koji sadrže informacije o bojama piksela na objektima na kojima se izvršava antialiasing. Pored standardnog multisampling AA algoritma i već poznatog, novog custom sample AA metoda, AMD se ponovo vratio supersampling antialiasing-u. Podsećanja radi, supersampling je najzahtevniji metod umekšavanja ivica koji praktično renderuje čitavu scenu u većoj rezoluciji, a onda je skalira u rezoluciju u kojoj se ona prikazuje (jedini pravi FSAA u pravom smislu te reči), dok se multisampling samo fokusira na ivice objekata. Supersampling i dalje daje najbolje rezultate, pa se uvek koristi kod offline render sistema, ali se manje koristi u realtime grafici zbog svoje neefikasnosti. Naravno, custom sample antialiasing metodi su zadržani kao neka vrsta trademark-a i najboljeg odnosa performansi i kvaliteta, baš kao što je slučaj i sa coverage sample antialiasing algoritmima kod GeForce kartica.
I rad sa multiple render target-ima (MRT) je poboljšan, jer je AMD uveo još efikasniji sistem za brzo pražnjenje pomenutog bafera, kako bi bio spreman za sledeći ciklus. Prethodno pomenute L2 keš memorije, koje su ovoga puta dvostruko veće i četiri puta efikasnije u odnosu na iste u prethodnoj generaciji bi trebalo da smanje pad performansi kada se koristi viši nivo multisampling antialiasing-a (8x u odnosu na 4x), ali će u svakom slučaju pomoći da se izbalansira nešto niži memorijski bandwidth (od očekivanog)koji je možda i jedini slabiji deo ovako moćnog GPU-a.
Kontroler koji omogućava prikaz slike na ekranu je potpuno redizajniran da se može reći da je ponovo kreiran – od nule. Naime, on sada podržava sve tipove video konekcija, od D-Sub-a, preko DVI-I i HDMI konekcije, pa sve do Display Port-a. Osim toga, novi display controller nudi mogućnost prikaza do čak šest video stream-ova uz preciznost od 10-bita po komponenti (boji). Ovaj programabilni deo GPU-a je tako i u mogućnosti da prikaže jedan “ekran” u fantastičnoj rezoluciji od 5760 x 2160 piksela. Štaviše, u ovoj rezoluciji se možete i igrati, mada sumnjamo da je i Radeon HD5870 dovoljan za igranje novijih igara u ovom modu (a za šta, uostalom, upotrebiti dve Radeon HD5870X2 u Crossfire modu? – prim.aut.). Kako prikazati ovu rezoluciju, pitate se? Svakako, uz više monitora, što vam omogućava ATI Eyefinity, ali o tome nešto kasnije u tekstu.
S obzirom na to da je, kako ćemo videti u sledećem pasusu, rad sa VRAM-om dodatno optimizovan tako da sada i GDDR5 čipovi imaju mogućnost rada na znatno nižim naponima (u 2D i intermediate režimu), Radeon HD5870, dok prikazuje desktop, troši svega 27W struje, što je fantastičan podatak. Maksimalna potrošnja ovako snažne kartice i nije preterano velika i iznosi svega 188W. Podsetićemo da je GeForce GTX285 u stanju da povuče preko 210W, a overklokovana izdanja GeForce GTX280 i blizu 250W, što je zaista mnogo za SingleGPU akcelerator!
Memorijski kontroler i VRAM
Kao što smo već pomenuli, memorijski kontroler se sastoji od četiri manja kontrolera širine 64 bita, baš kao što je slučaj i sa RV790, RV770 i RV670. Cypress koristi GDDR5 tip memorije, a ovo je četvrta generacija Radeon kartica (ako se Radeon HD4890 može nazvati novim modelom, u odnosu na HD4870 samo jer koristi malo dorađeni GPU). Svakako, Radeon HD5870 ima nešto manji maksimalni memorijski propusni opseg od najjačeg SingleGPU konkurenta prethodne generacije (GeForce GTX285), što je rezultat 256-bitnog memorijskog kontrolera, kakav ima i Radeon HD4890. Kako onda možemo računati na to da će RV870 uspeti da nadmaši DualGPU soluciju prethodne generacije? AMD je definitivno odustao od ring-bus sistema memorijskog kontrolera i vratio se onom koji po organizaciji više podseća na klasičan crossbar tip. Međutim, novi memorijski kontroler je dodatno optimizovan za rad sa ultra brzom GDDR5 memorijom. Osim većih bafera o kojima smo već pisali, a koji se nalaze “između” render back-end dela i memorijskog kontrolera, više frekvencije su postignute uvođenjem EDC sistema (Error Detection Codes) i kompenzacijom temperature. EDC je zapravo CRC check na svakom od transfera podataka, dok nam za Memory Clock Temperature Compensation nije baš najjasnije kako funkcioniše, jer nam sam naziv ove funkcije nije previše logičan, a više podataka o ovom sistemu nismo našli u priloženim dokumentima. Treća dodatna funkcija je i mogućnost promene radne frekvencije memorije i njenog napona, pri promeni aktivnog stanja čitavog akceleratora (ovo je i ranije bilo moguće, ali je radni napon memorije uvek ostajao isti). To je konačno omogućilo da Radeon HD5870 akcelerator troši izuzetno malo u stanju mirovanja, što je izuzetno bitna stavka.
Uz EDC i “kompenzaciju temperature” je omogućen još veći efektivan “klok” VRAM-a, koji sada bez problema ide od 5 GHz (1250 MHz, realno). Svakako, memorijski propusni opseg je povećan, a PCB nije dodatno zakomplikovan. Ipak, bandwidth i nije mnogo veći, jer je i Radeon HD4890 imao impresivne VRAM performanse. S obzirom na to da je computing deo GPU-a pojačan duplo, a memorijski podsistem za tridesetak procenata, sasvim je moguće da će Cypress arhitektura, u ekstremnim rezolucijama tek pokazati šta može kada se pojavi GDDR5 koji efektivno radi na 7-8 GHz.
Još jedna novina, kojom zaključujemo “hardverski” deo priče (bar dok se ne posvetimo opisu same Radeon HD5870 kartice), vezana je za činjenicu da ova kartica ima mogućnost samo-regulacije naponske jedinice. Naime, regulatori napona mogu GPU-u obezbediti tačno onaj napon koji mu vi zadate (putem soft-mod-a u bios mod aplikaciji), a isto važi i za regulator napona video memorije.
DirectX 11, konačno
DirectX 10 nije bio toliko prihvaćen od strane programera koji razvijaju zabavni softver. Iako je, bar na papiru, delovao kao prilično veliki i važan korak u odnosu na DirectX 9. Pa ipak, za to je velikim delom kriv i Microsoft, koji je želeo da se Windows Vista proda u što većoj meri, iako to realno nikako nije “zaslužila”, pa je DX10 bio ekskluzivnost ovog OS-a. Windows 7, koji je značajno bolji operativni sistem, nije ekskluzivan za DirectX 11, koji će radit i na Windows Vista OS-u, ali će, u to smo ubeđeni, biti prihvaćen znatno brže od strane krajnjih korisnika, nego što je to bila Vista. DirectX 11 je prilično važan korak u napretku ovog API-ja i, mada smo tako nešto već rekli za prethodni, smatramo da je DX11 bitan jer će biti prihvaćeniji od svog prethodnika, a samim tim će i postati “ono što je DX10 trebalo da bude”. U tom smislu je itekako bitan i to ne tvrdimo samo zato što donosi dosta poboljšanja u odnosu na prethodnika. Uostalom, doneo je i DirectX 10 u odnosu na “devetku” pa ga je dobar deo game developer komune praktično ignorisao.
Kao i ranije, novi API donosi nešto od čega će koristi imati i programeri, ali i krajnji korisnici. Izvršavanje kompleksnih šejder programa, koji su bili praktično izbegavani ili aproksimirani do sada će biti znatno ubrzano, a neke od novih funkcija su tek sada i realno moguće, bez drastičnog pada performansi koji bi bio iminentan kada bi bio realizovan kroz DirectX 10. DirectX 11 donosi Hull, Domain i Compute Shaders, a dalje poboljšava, ubrzava i proširuje rad sa Geometry, Pixel i Vertex Shaderima. Unutar Compute Shaders sistema sada je i DirectCompute 11, koji omogućava da sam OS ili aplikacija ima direktan pristup GPU-u, što je slično principu kojim se OpenGL „rukovodi“ od svog nastanka. O DirectCompute 11 sistemu ćemo više reći nešto kasnije. Dakle, DirectX 11 nam donosi DirectCompute 11 (ubrzanje general purpose aplikacija, ali API koji obezbeđuje ubrzanje fizike i kalkulaciju veštačke inteligencije putem GPU-a), zatim Shader Model 5.0, naprednije senčenje, kompresiju HDR tekstura, standardizuje Hardware Tesselation i multi-threading.
DirectCompute 11, Multi Threading, Tesselation, HDR texture compression
Oslanjanjem na DirectX 11 DirectCompute, programer aplikacije namenjene Vista i Windows 7 operativnom sistemu sada može da iskoristi enormnu količinu processing moći GPU-a za ubrzanje praktično bilo koje vrste koda. Najviše, pak, ima smisla kompajlirati aplikaciju koja radi na obradi velike količine podataka odnosno aplikacije koje imaju veliki throughput, poput aplikacija za transkoding video materijala, rendering ili rad sa složenim filterima na velikim fotografijama. Takve aplikacije se lako mogu multi-threadovati, jer se velika količina podataka za obradu može podeliti u „niti“ koje bi se paralelno izvršavale kroz ogroman broj SIMD jedinica, odnosno stream-shader procesora unutar GPU-a. Takva vrsta obrade podataka se naziva Stream Computing. DirectCompute 11 omogućava čist, jednostavan i direktan pristup resursima grafičkog procesora, koji se, kao što vidimo, danas može iskoristiti i za ubrzanje aplikacija koje nemaju veze sa igranjem. U budućnosti će general purpose stream computing postati vrlo rasprostranjen, pa jednog dana više nećemo biti sigurni koje taskove obavlja grafički, a koje centralni procesor.
Pošto su i igre aplikacije, svakako da je moguće i njih pisati za DirectCompute 11, mada bi to zahtevalo prilično radikalne promene unutar razvojnih timova koji su već navikli na Direct3D ili OpenGL, ali je dobro što je DirectCompute 11 standard deo DirectX 11 API-ja i kao takav omogućava da se deo aplikacije, jedan njen feature obavlja putem “direktnog pristupa GPU-u”. Tako, recimo, programeri mogu da kreiraju engine čiji će filtering tekstura biti obavljan putem DirectCompute 11 sistema, ako se pokaže da takav način obezbeđuje bolje performanse. Ili, ako igra poseduje veliki broj post-processing efekata, kakvi su depth of field ili object motion blur, koji bi opteretili engine, isti se mogu prebaciti na DirectCompute 11, gde će ih streaming jedinice “samleti” bez uplitanja više posrednika (engine (koji se rasterećuje bar dela “obaveze”), drajver,kompajler , API…). U ovom slučaju GPU se ponaša više kao CPU koji obavlja deo grafičkih kalkulacija u krajnje netradicionalnom maniru, što je, u neku ruku slično programiranju za PlayStation 3 platformu, na kojoj se “grafički procesor” koristi uglavnom za scenski (triangle) setup i “lepljenje” tekstura, dok sav post-processing obavlja moćni Cell procesor. Bar je takav slučaj sa timovima koji prave ekskluzivne naslove za ovu platformu, koje obično izgledaju za dve klase bolje od multi-platformskih igara.
Naravno, pisanje čitave igre za DirectCompute 11 ne bi rezultovalo boljim performansama, jer bi se kompletna priprema 3D scene, ali i izvršavanje ostatka komponenti koja čini jednu igru (fizika, AI, zvuk, input), prebacio isključivo na streaming jedinicu, što nema mnogo smisla ako znamo da GPU već ima nešto specijalizovanije celine za efikasan rad sa grafikom. Ipak, prebacivanje kalkulacija veštačke inteligencije i fizike na DirectCompute 11 je nešto što ćemo sigurno videti u bliskoj budućnosti. DirectCompute 11 će omogućiti i implementaciju drugačijih vrsta game engine-a, kakve su se ranije izvršavale na centralnom procesoru (voxel tip prikaza realtime grafike) ili nečega što u igrama još uvek nije viđano, bar ne van tehnoloških demoa, a to je Ray Tracing.
AMD je već prikazao i demo koji pokazuje konkretnu primenu DirectCompute 11 sistema, koja se zove Order Independent Transparency, a koja prikazuje kompleksan model robota (kao iz igre Mech Warrior) unutar koga se vide i unutrašnji delovi, kao na nekom moćnom rentgenu. Razlika između ove vrste transparentnosti i tradicionalne je veoma velika, jer se vide samo delovi objekta koji bi se videli i u realnosti (sastav iste gustine zaklanja sebe samog i manje guste delove iza, dok manje gusti delovi ne zaklanjaju unutrašnjost). Malo je teže za objasniti, ali pokušajte da pažljivo pogledate sliku, pa će vam biti jasnije. Pomoću OIT metoda se realističnije može prikazati dim, vatra, trava, kosa, ograde i druge slične površine i objekti bez nuspojava koje su poznate svakom današnjem igraču.
GPU
DirectX 11 Feature
DX10
DX 10.1
DX 11
Tesselation
Ne
Ne
Da
Shader Model 5.0
Ne
Ne
Da
DirectCompute 11
Ne
Ne
Da
DirectCompute 10.1
Ne
Da
Da
DirectCompute 10
Da
Da
Da
Multi-threading
Da
Da
Da
HDR Texture compression
Ne
Ne
Da
Multi-threading je način obrade paketa informacija, odnosno koda, koji grafičkom procesoru najviše prija. Implementacija multi-threading-a unutar DirectX 11 API-ja omogućava “serviranje” baš ovako spremljenog koda, koji se tokom obrade u GPU-u naziva multi-threaded rendering.
Shader Model u verziji 5.0 je High Level Shader Language (HLSL) koji pruža još dodatnih i novih načina za implementaciju shader programa. U odnosu na prethodnu verziju donosi podršku za double-precission, odnosno podršku za još duže i kompleksnije shadere.Kao što smo već napomenuli, hardverski tesselator prisutan i u RV870 GPU-u, koji ATI razvija još od 2001. godine, a koji je u praksi najviše korišten unutar Xenos GPU-a kod Xbox 360 konzole, sada je podržan i od strane DirectX 11 API-ja. Dalje usložnjavanje objekata putem sub-division algoritama je moguće izvesti na više načina, ali su u DirectX 11 API-ju podržani već pominjani Hull Shader i Domain Shader algoritmi. Jasno je da Tesselator samo može da učini da uglastiji objekat postane obliji, što će biti od pomoći na nekim objektima i terenima, ali ne može da kreira neke suptilne detalje na objektu, koje sam dizajner nije predvideo na njemu. Zato je za postizanje finih detalja na objektima i dalje neophodno koristiti displacement mape, kakve su bump teksture ili occlusion mape, koje se mogu koristiti i u sprezi sa transparentnim detailed mapama koje dodaju detalje na objektima sa baznom kolor teksturom bez potrebe da ista bude u ultra-visokoj rezoluciji. I za kraj ćemo navesti i da DirectX 11 podržava novu tehniku za kompresiju HDR tekstura, koje se dele na dva metoda – BC6 i BC7. Block Compression 6 podrazumeva kompresiju HDR podataka u odnosu od 6 : 1 uz zadržan visok kvalitet (male gubitke) i prilično dobre performanse. BC7 se koristi za kompresiju 8-bitnih low-dynamic range slika u odnosu 3 : 1.
A igre…
S obzirom na to da je DirectX 10 već duže vreme prisutan, a nije baš previše rasprostranjen (većina igara se i dalje uglavnom oslanja na DirectX 9), postavlja se logično pitanje kada će programeri da počnu da koriste sledeću generaciju ovog API-ja. Iako je DirectX 10 za mnoge bio “odbojan”, tu je i činjenica da se dosta naslova razvijalo za Xbox 360, pa bi podrška za DX10 samo dodatno oduzela vreme i nepotrebno produžila time to market. Situacija je drugačija sa DirectX 11 generacijom i ova verzija API-ja će, po svemu sudeći, biti daleko brže prihvaćena. Neki naslovi su se već pojavili na tržištu, dok se neki očekuju do kraja godine. Među njima je svakako i real-time strategija BattleForge koju izdaje Electronic Arts i koja je prvi DirectX 11 naslov koji se pojavio na tržištu. Jedna od naprednih funkcija koju ova igra podržava kada se pokrene u DX11 modu je i High Definition Ambient Occlusion, koji omogućava podizanje realističnosti scene krajnje efektivnim načinom senčenja. Šteta što je igra samo fantasy RTS – neki foto-realistični demo ili igra bi daleko bolje ilustrovali koliko zapravo donosi HDAO.
Uskoro će se na tržištu naći i englesko izdanje ruskog naslova S.T.A.L.K.E.R: Call of Pripyat, FPS RPG igre koja takođe podržava DX11, ali i izgleda prilično dobro. Ono što smo mogli da vidimo na screenshot-ovima je, za sada, podrška za napredne senke koje su oštrije kada su bliže objektu i sve mekše kako su dalje od njega. Colin McRae DIRT 2 je nedavno izašao u verziji za Xbox 360 i PlayStation 3, ali će u izdanju za PC podržavati i DirectX 11, što znači da će posedovati unapređene efekte na vodenim površinama (koristi se tesselator), bolje i detaljnije modele, detaljnije senke i druge novine (za sada se ne zna dokle će programeri ići sa implementacijom DX11 mogućnosti ali igra za sada ne izgleda bitno drugačije od verzije za Xbox 360).
Svakako najviše iščekivan naslov je i Aliens Vs. Predator od Rebellion Games-a, tima koji je kreirao prvu AVP igru. Ako je sudeći po screenshotovima, igra zaista ima potencijala kada je prezentacija u pitanju. Osim High Definition Ambien Occlusion-a, podržavaće i Hardware Tesselation, što znači da će Alien i Predator izgledati strašnije nego ikada. Nažalost, igra će se pojaviti tek na proleće naredne godine.
Universal Video Decoder 2.0
Prva generacija AMD Unified Video Decoding engine-a je već bila dovoljno usavršena i o njoj smo više puta pisali. NVIDIA grafičkih procesori od G84 na ovamo, kao i nova familija Radeon HD2000 (bez 2900XT i Pro modela) i HD3000 akceleratora imaju posvećeni video processing engine koji ATI naziva Unified Video Decoder. U odnosu na AVIVO, UVD je napredovao koliko i PureVideo HD druge generacije u odnosu na rešenje iz GeForce 7 familije, a nakon njegovog izostanka ili nefunkcionalnosti kod R600 kartica, našao je svoje mesto kod aktuelne HD3800 serije. AMD tvrdi da je smanjenje CPU utilizacije pri posmatranju H.264, a posebno VC-1 video formata, koji su postali standardni video kodeci za BluRay naslove zaista vredno pažnje, čak i na desktop sistemima. Prilikom obrade HD video signala, pred grafičkom karticom stoji izazov koji se ne završava samo na procesiranju bar 6x više informacija u odnosu na video signal standardne definicije. Jednostavno rečeno, grafičke kartice poseduju specijalnu logiku koja im objašnjava kako da brojne shader jedinice iskoriste za obradu video signala. Pošto su GPU-ovi sve moćniji, zbog čega stati na 1080p rezoluciji? AMD je proširio podršku i za XHD rezolucije, što nam nije teško da zamislimo jer, ako ove kartice bez problema rade sa stotinama tekstura visoke rezolucije koje “lepe” na hiljade poligona u 3D igrama, zbog čega ne bi mogle da, tridesetak puta u sekundi, nalepe jednu “teksturu” na jednu površinu na ekranu. Naravno, jasno je da se na tu “teksturu” primenjuju malo zahtevniji algoritmi od običnog trilinear ili anisotropic filtera, brinuti o daljem toku podataka, korekciji i kompenzaciji pokreta, de-interlacing-u i tome slično, ali je sve to, složićete se, i dalje manje kompleksan “shader program” od “sličnih” rutina u modernim igrama.
Početne BitStream i Entropy Decode faze se sada izvršavaju od strane GPU-a. UVD je kreiran da u potpunosti dekodira i najzahtevnije (i najnaprednije) video kodeke kakvi su VC-1 i H.264, uključujući i bitrate od 40 Mbps ili više i koristi već postojeća, programabilna SIMD jezgra, odnosno Stream Processors jedinice. Ono što novi Radeon HD4800 GPU-ovi podržavaju, a od nedavno i konkurencija sa novim GPU-ovima, naziva se full-speed CABAC i CAVLC dekodiranje u okviru H.264 i VC-1 kodeka. Sav postprocessing se obavlja unutar shader jedinica, uz primenu filtera koji su ništa drugo do namenski kreirani shader programi koji se u potpunosti izvršavaju in hardware. HDMI, odnosno High Definition Multimedia Interface je u potpunosti podržan od strane RV670 GPU-a, zajedno sa obaveznim HDCP (High-bandwidth Digital Copy Protection) sistemom zaštite od kopiranja. Osim digitalnog signala, HDMI konektor “prenosi” i više kanalni audio zvuk, koji RV770, kao i RV790 i RV870 podržavaju. Novina kod Cypress GPU-a je i hardverski upscale 1080p filmova u rezoluciju 2650 x 1600 piksela, što zaista izgleda impresivno. Novine UVD 2.1 (da ga tako nazovemo) endžina su sledeće:
• Hardware acceleration dekoding za dva 1080P HD stream-a
• Kompatibilnost sa Windows Aero modom – reprodukcija HD video klipova uz aktivan Aero Glass mod na desktopu
• Video gamma – gamma kontrola je nezavisna od iste koja važi za Windows desktop
• Brighter whites – Blue Stretch procesiranje povećava vrednost svetlijih tonova za dinamičniji prikaz videa
• Dynamic Video Range – bolja dinamička kontrola tamnih tonova i crne tokom reprodukcije
Dodate su i funkcije Dynamic Contrast Enchancement i Dynamic Color Enchancement za koje već iz samog naziva možete da predpostavite koju ulogu imaju. Kod prethodne generacije UVD-a smo imali podršku za maksimalno 5.1, 16-bit PCM Stereo ili kompresovani AC3 5.1 više kanalni audio-stream po Dolby Digital i Dolby DTS standardima, ali je to kod RV770 i novijih čipova sve dovedeno na viši nivo – sada je podržan osmokanalni (7.1) audio uz maksimalan bitrate od 6.144 Mbps i sempling od 192KHz i 24-bita. Podrška za “filmske” formate se ne zaustavlja na Dolby DTS i Digital standardima – tu su sada i True-HD i DTS HD formati u koje se slažu zvučne slike na novim BluRay izdanjima.
Još jedna od bitnih novina je i mogućnost dual-stream plejebeka, pa RV870 može da pusti dva HD video feed-a i to u modu “slika-u-slici” sa kompletnim de-kodiranjem kroz VC-1, H.264 i MPEG-2 (uz upscaling DVD formata u HD rezolucije i nove profile sa dinamičkim kontrastom). AMD će uskoro na websajt pustiti i novu aplikaciju Accelerated Video Transcoding koja će omogućiti transkoding HD video formata u MPEG-2 ili H.264 i to oko 19 puta brže nego Intel Core 2 Duo E8500 CPU (mereno za klip u 1080p rezoluciji). Ovaj algoritam će se pojaviti i u obliku plug-in-a za Cyberlink's PowerDirector aplikaciju, a ubrzo i druge popularne programe.
ATI EyeFinity
Na prvih nekoliko strana smo pominjali i mogućnost Radeon HD5870 akceleratora da prikaže sliku na čak šest monitora. Svakako, za tako nešto vam je potrebno specijalno izdanje koje se naziva Radeon HD5870 Eyefinity6 Edition – kartica koja ima šest video konektora. Međutim, čak i sa običnim izdanjem je moguće povezati do tri monitora od 30 inča i objediniti ih u jedan desktop rezolucije od 7680 x 1600 piksela i igrati igru u ovom monstruoznom grafičkom režimu. Eyefinity6 edicija ove kartice, tako, može da pruži fantastičnih 5760 x 2160 piksela (ako se upotrebi svih šest displeja, maksimalna rezolucija za svaki od njih se spušta na 1920 x 1080 piksela), u kojima možete igrati Crysis, Flight Simulator, Dirt 2, Need For Speed Shift ili skoro bilo koju aktuelnu igru koja vam padne na pamet. Naravno, za solidne performanse u tako monstruoznim grafičkim modovima će biti neophodno i da dodatno osnažite grafički podsistem sa još jednom, dve ili tri Radeon HD5870 kartice, ali ako baš imate viška para, prostora i sebe smatrate ultimativnim igračem, dobro je znati da je i ovako nešto moguće. Štaviše, u CrossFire X varijantama je moguće povezati čak i 24 monitora, što će se retko viđati i na sajmovima, ali je sjajna demonstracija sile!
Pogledajmo sada kako to izgleda u praksi – za sada, bar na slikama. Iskreno rečeno, nama sve to izgleda impresivno, ali nam prilično smetaju okviri ekrana koji kvare zadovoljstvo i to u velikoj meri. Jedva čekamo da se neko doseti da kreira rešenje koje će imati spojene displeje bez ikakvih ivica. Smatramo da je tako nešto sasvim izvodljivo. Daleko je impresivnija podrška za ATI Stream, iako je u medijima znatno manje obrađivana. ATI Stream je zapravo pandan NVIDIA CUDA sistemu, ali je potpuno otvoren standard. Ipak, iako postoji godinu dana, sada se pitamo koliko će se dalje razvijati, s obzirom na to da je sada dostupan daleko konkretniji – DirectCompute 11.
Juniper – sličnosti i razlike manje snažnog brata
Kao što možete da predpostavite, Juniper je baziran na istoj arhitekturi kao i Cypress, pa sa njim deli i iste mogućnosti, odnosno feature set. Zbog toga i jesmo čitavu priču o toj arhitekturi ponovili na prethodnoj strani. Radeon HD5700 GPU je takođe proizveden u 40-nanometarskom procesu, baš kao i pripadnik prethodne generacije, RV770 – Radeon HD4770, koji je i jedini čip iz prethodne, DirectX 10.1 serije, koji je izrađen u ovom procesu, a istovremeno je i prvi GPU sa kojim se AMD “prebacio” na sitniju litografiju. Juniper se sastoji od oko 1.04 milijarde tranzistora, što je više od 50% manje u odnosu na 2.15 miliona ovih osnovnih poluprovodničkih elemenata, koliko ih ima kod Cypress jezgra. Istovremeno, ova cifra je i nešto veća od 956 miliona tranzistora kod RV770 GPU-a (Radeon HD4890), koji je izrađen u 55-nm procesu. Svakako, usvajanje novijeg Shader Modela i dodatne optimizacije na nivou keš memorije i SIMD jedinica su učinile da GPU koji ima sličnu “snagu”, bude, mereno sirovim brojem tranzistora, nešto kompleksniji, bez obzira na to što čak ima i dva puta manji broj memorijskih kontrolera. Ako pogledamo dijagram Juniper jezgra…
Juniper jezgro
…videćemo da ima mnogo sličnosti sa onim koji smo prikazali pri opisu Cypress-a. Zapravo, Juniper izgleda kao jedna polovina Cypress-a, što se čak prenelo i na memorijski kontroler. Dakle, sada je tu 800 streaming procesora, unutar istih SIMD jedinica, kojih je sada deset u jezgru. O ovim SIMD jezgrima više informacija možete saznati na prethodnoj stranici. Kao i kod Radeon HD4890, HD4870 i HD4850 grafičkih procesora, Radeon HD5700 GPU poseduje 10 teksturnih jedinica, a o njima smo takođe detaljnije pisali na prethodnoj stranici. “Prepolovljen” je i render back-end, pa je broj ovih jedinica kod Juniper-a – 16, ali su one naprednije od 16 ROP-ova kod prethodne generacije (takođe savetujemo da pogledate prethodnu stranu). Memorijski kontroler se sastoji od dva crossbar dela, ili stanice, širine po 64-bita, što daje ukupnu širinu magistrale od 128 bita. Cypress poseduje četiri ovakva kontrolera.
Cypress jezgro
Radeon HD5770 je prva kartica sa Juniper GPU-om koju smo testirali i koju ćemo predstaviti. Grafički procesor, po default-u, radi na 850 MHz, baš kao i kod modela Radeon HD4890, što daje compute moć od čak 1.36 TeraFLOPS-a. Impresivno je da ovaj mali “super kompjuter” sada može biti vaš za 150-ak evra! 1GB GDDR5 memorije bi trebalo da radi na 1200 MHz, a kako je GDDR5 praktično quad-data rate memorija, ova cifra pomnožena sa četiri daje efektivnh 4800 MHz, što je, upotrebićemo ponovo isti epitet – impresivna cifra. Doduše, brza memorija je sada vrlo dobrodošla, jer je magistrala dva puta uža, pa bi Radeon HD5770 mogli da posmatramo i kao karticu sa 256-bitnom magistralom i GDDR3 memorijom na efektivnih 2.4 GHz. Istini za volju, GDDR3 memorija ima nešto oštrije tajminge, ali to kod video kartica nije o tako presudnog značaja za performanse kao kod sistemske RAM memorije.
Tehnologija o kojoj smo takođe pričali na prethodnoj strani, vezana za uštedu energije kada je kartica u idle režimu, odnosno kada je neopterećena, primenjena je i kod Radeona HD5770, a pošto se radi o znatno manjoj kartici, znatno manjem GPU-u i manjoj količini VRAM-a, maksimalna potrošnja u ovoj situaciji (dakle, kada je monitor ugašen i kada mašina, recimo, izigrava download server) je svega 18W, što je još jedan impresivan podatak. Kod Radeon HD5750 modela, Juniper jezgro ima manji broj aktivnih streaming processors jedinica (njih 720, odnosno jedan SIMD unit manje), a sam grafički čip radi na 700 MHz. O ovoj kartici ćemo, naravno, detaljnije pisati kada je budemo imali u rukama. Za sada, pogledaćemo slike i preći na priču o Radeon HD5770 sempl modelu sa testa…
Hemlock
Nova grafička kartica – ako se tako može nazvati novi šampion visoke teške kategorije, nazvana je jednostavno Radeon HD5970. AMD je odustao od X2 sufiksa zbog pojednostavljenja i manje mogućnosti da se kupci zbune ili da ne shvate dobro ono X2 na kraju oznake. S druge strane, interni Crossfire na ovoj kartici je nekako još sakriveniji – korisnik više ne mora da brine, kao ranije, da li je on aktiviran ili ne i tako je još od ranijih verzija Catalyst drajvera. I zbog toga je i želja AMD-a, a verujemo i svih zbunjenih i frustriranih korisnika prvih generacija Crossfire sistema, da se sledeći Radeon X2 tretira i ponaša kao i svaki drugi grafički akcelerator.
Iako smo se na prethodnoj strani ponovo podsetili bitnih činjenica vezanih za arhitekturu Cypress GPU-a, novim mogućnostima koje donosi i na nivou samog čipa, ali i na nivou krajnjeg proizvoda, kao i sa novinama DirectX 11 API-ja i svim komponentama koje su sada njegov sastavni deo. Sve što je tamo rečeno, naravno, važi i u slučaju Hemlock-a, što je kodni naziv za Radeon HD5970. Ovaj grafički akcelerator praktično uzima sve fantastične osobine Radeona HD5870 i podiže ih na daleko viši nivo ili – da budemo precizniji, dva puta viši nivo – bar kada su performanse u pitanju.
3200 ALU jedinica, 160 teksturnih i čak 64 render back-end jedinice su cifre od kojih nam se, već na prvi pogled, ledi krv u žilama, iako se uvek setimo da bi tu snagu moguće iskusiti jedino tokom neke EyeFinity igračke sesije. Igranje Dirt 2 ili Crysis Warhead-a u 7680 x 1600 piksela bi bilo divno iskustvo, pa ako neko ima mogućnosti da ga sebi pruži, svakako bi smo voleli da nas pozove u goste. S druge strane, ova kartica ima toliko rezervne snage, da će sigurno i dobro optimizovanu DirectX 11 igru koja se pojavi 2013. godine, prikazivati bez problema bar u Full HD rezoluciji.
Dakle, Radeon HD5970 je napravljen po istom scenariju kao i prethodnici – Radeon HD4870 X2 i Radeon HD3870 X2. Međutim, za razliku od prvog prethodnika, radne frekvencije samog GPU-a su nešto niže, kako bi se postigla manja toplotna disipacija, ali delom, verovatno i zbog toga da bi igrači i overklokeri imali i čime da se igraju (osim u samim igrama, za koje su ove kartice i napravljene – prim.aut.). Frekvencije svakog od grafičkih čipova su smanjene sa 850 MHz (na koliko su podešene kod HD5870) na 725 MHz, dok je “klok” VRAM-a spušten sa 1200 na 1000 MHz (sa 4.8 na 4.0 GHz, efektivno). Naravno, uz sve to, smanjeni su i radni naponi, jer je ova dva GPU-a potrebno i ohladiti. Ako ste čitali naš opis rashladnog sistema koji je instaliran na Radeon HD5870 akceleratorima, videli ste da se i jedan RV870 GPU svakako prilično zagreva tokom rada – zamislite kako se onda greju dva ista, postavljena relativno blizu jedan drugom. Istina, cela Radeon HD5970 kartica i njen rashladni sistem moraju biti veći, ali u svetu računara postoje određeni standardi, pa čak i velika kućišta imaju neke svoje limite kad su dimenzije u pitanju. I pored toga, čini se da su u AMD-u “nadmašili sami sebe”, a i naša očekivanja. No, na kraju se opet i još negde mora platiti cena ako želite najbržu i najmoderniju grafičku karticu današnjice! Po svemu sudeći, ona će i ostati na toj poziciji jako dugo, jer NVIDIA još uvek nema ni prve semplove “Fermi” hardvera koji rade na ciljanim učestanostima, čak ni za potrebe već naručenih Tesla super-računara. Ne sumnjamo da će Fermi biti brz i revolucionaran GPU, ali smatramo da će, čak i kada se pojavi, AMD zadržati ubedljivu best buy prednost u svim cenovnim kategorijama. Nazovite to i novinarskim predosećajem, ako tako želite…
Kartica na testu – AMD Radeon HD5970
Prva AMD Radeon HD5970 kartica koju smo testirali stigla nam je direktno od kompanije AMD – čuveni Non Qualification Sample, kojoj će biti identične i prve HD5970 kartice koje budu stizale od svih vendora-partnera. Sama kartica ima isto dizajniran hladnjak kao i Radeon HD5870, ali je osetno duža. I dok je Radeon HD5870 bio za milimetar duži od Radeona HD4870X2 (27.1 i 27 cm), novi dvoglavi zmaj je toliko veliki, da ćete zbog njega sigurno morati da menjate i kućište. Znamo da smo to rekli još i za Radeon HD4870X2, ali sačekajte još ovaj podatak – pomenuti X2 model prethodne generacije je prilično dugačka, teška i glomazna kartica, ali deluje malešno u poređenju sa Radeonom HD5970, koji je čitavih sedam (da, 7) centimetara duži. Sa 342 milimetra se ne treba igrati, pa je sva sreća da smo mi nedavno apgrejdovali test računar, tako promenivši i stari dobri WaveMaster za Cooler Master Cosmos 1010 ESA kućište, koje je zaista prostrano. Kada ga instalirate, svakako ga učvrstite pre nego što kućište vratite u vertikalan položaj, jer je kartica prilično teška (1240 grama), te može oštetiti PCIe x16 slot.
Radeon HD5970 u startu radi na 2 x 725 MHz, baš kao i HD5850, ali ima sve aktivne streaming jedinice. GDDR5 memorija je podešena, takođe kao i kod jeftinijeg brata – na skromnih 1000 MHz, odnosno efektivnih 4 GHz, što daje propusnu moć memorije od 4 gigabajta po sekundi, po jednom GPU-u. Kartica koju predstavljamo, Radeon HD5970 bi na našem tržištu trebalo da košta između 550 i 600 evra, što nije mala cifra, kao što ni sama kartica nije namenjena baš svakom igraču. Za nju je neophodno obezbediti i dosta jak ostatak sistema, počev od samog kućišta i naravno, napajanja. Osim što je ogromna, po dizajnu se ne razlikuje od dva slabija (i kraća brata iz serije HD5800). Plastični poklopac ni ovoga puta, dakle, nema nekih dizajnerskih aspiracija, pa sama kartica deluje prilično monolitno, a ako zanemarimo dva usisnika sa prednje strane i logotip kompanija AMD, ATI i utisnutog logoa sa nazivom ovog modela, mogli bi smo reći da je serija Radeon HD5800 do sada najelegantnija, jer je krajnje minimalistički dizajnirana. Naravno, kartice koje budu stizale od partnera će po površini poklopca imati i dodatnu nalepnicu sa obeležjima same kompanije, ali će, verujemo, biti identična referentnom modelu (uz sasvim moguće i više radne učestanosti).
Sapphire Radeon HD 5850 poseduje čak četiri video konektora spremnih za prikaz XHD rezolucije. Dva DVI-I konektora i jedan HDMI je nešto što smo očekivali, ali nas je iznenadilo da nema HDMI priključka, koga je ovoga puta zamenio novi DisplayPort priključak. Uostalom, HDMI lako možete dobiti iz DVI-I konektora, najobičnijim adapterom, koji bi trebalo i da bude isporučivan uz kartice. S druge strane, adapter sa nekog drugog priključka na Display Port je još uvek pomalo egzotična stvarčica. Kao i Radeon HD4xxx i HD5xxx serija, i Radeon HD5970 podržava audio-over-HDMI. Audio drajver će biti instaliran nakon instalacije Catalyst paketa (koji sada, izgleda sa razlogom, teže preko 120 MB u internacionalnoj verziji – za sve aktuelne Windows operativne sisteme sa kernelom iste binarne širine). Ovaj audio drajveri sasvim normalno egzistira uz vašu već postojeću zvučnu karticu u računaru, a sam audio kodek integrisan u Radeon GPU podržava osmokanalni zvuk u kompresovanim i nekompresovanim formatima (DTS, DTS HD, AC3, Dolby TrueHD (i starije verzije, naravno), kao i LPCM). Iako je Radeon HD5970 već Crossfire sistem sam po sebi, dodatni Crossfire konektor omogućava kreiranje CrossFire X sistema sa četiri GPU-a koji bi u teoriji raspolagali sa 6400 ALU jedinica, 320 teksturne i 128 render back-end jedinice.
Kada se jednom rasklopi zaista veliki rashladni sistem postavljen na ovu karticu – prvo što ćete zapaziti je zaista veliki broj impresivno pedantno složenih komponenti. Tu su dva RV870 GPU-a, te iznenađujuće veliki PCI Express switch čip sa oznakom AMD8647. Ovaj čip je AMD-ova verzija kontrolera koji je ranije nabavljan od kompanije PLX Technology (PEX8647) ili je u pitanju isti čip sa drugačijim oznakama (kao što na nekim procesorima u Xbox360 konzoli piše Microsoft J). Ovaj čip je i na Radeon HD4870X2 kartici imao ulogu da preusmerava do 48 PCI Express linija – koje se koriste i za komunikaciju između samih GPU-ova. Svaki GPU ima čitav set streaming jedinica u funkciji, dakle kao i kod Radeon HD5870 akceleratora, s tim da su radne učestanosti iste kao kod modela Radeon HD5850.
Kao što smo već rekli, Radeon HD5970 preuzima i unapređuje koncept koji smo videli kod Radeon HD4870X2 modela, što se naravno odnosi i na sam layout, tj. dizajn PCB-a i raspored komponenti na njemu. PCB je dosta “gušći” u odnosu na Cypress kartice, što je i razumljivo, s obzirom da su na nekih 25% dužoj kartici smeštena dva, a ne jedan RV870 GPU, te i pomenuti PCI Express switch čip i dva odvojena seta GDDR5 čipova, svaki za sopstveni GPU. Uz sve to, tu su i naponske jedinice, koje ne mogu ostati iste kao i u slučaju modela koji znatno manje troše. Naponski segment koji “hrani” GPU, izrađen oko kontrolera iz Volterra porodice (VT1165MF sa tri faze na HD5850, odnosno četiri na HD5870 kartici) zamenjen je sa Voltera VT1157SF kontrolerom koji prati i, gledano sve ukupno, 8-phase sekcija za filtriranje napona i dalje prosleđivanje struje. Primarni GPU je vezan za prvi deo naponske sekcije koju čini pet faza, sa predviđenim mestom za još jednu, dok drugi napaja 3-phase sekcija sa, takođe, jednim mestom za dodatnu. Drugim rečima, moglo bi se reći da sve izgleda kao da su na jednu Radeon HD5970 karticu preseljene naponske jedinice sa jedne HD5870 i jedne HD5850 kartice, ali su samo nešto gušće složene.
Naponske faze kontrolišu specijalizovani kontroler-čipovi, Volterra VT1157SF i već pomenuti VT1165MF čip, koje smo uočili i na Radeon HD5800 karticama. Memorijske module takođe napaja sekcija koju nadgleda VT1157SF. Upravo pomenuti čipovi obezbeđuju pametni monitoring i predstavljaju temelj ATI-jevog power management sistema koji nam je poznat kao PowerPlay. Kartica se napaja preko PCIe x16 magistrale i dva dodatna PCI Express konektora od kojih jedan ima standardnih šest, a drugi osam pinova (2×4) i koji se još nazivaju i 6-pin PCI Express 1.0 i 8-pin PCI Express 2.0 na nekim modernim napajanjima. Kao i uvek, konektori su smešteni na samom kraju PCB-a, pri gornjoj ivici, u pravcu ventilatora, što je bolja pozicija i jasno je da su konektori na tom mestu jer je ova kartica jako dugačka, pa bi dodatni konektori na njenom krajnjem delu bili problematično pozicionirani i u većim kućištima.
Na PCB-u se jasno vidi da je na karticu instalirana već poznata Hynix GDDR5 memorija. I dok Radeon HD5850 i HD5870 koristi Samsung GDDR5 memorijske čipove (K4G10325FE-HC04 čipova kapaciteta od jednog gigabita koji rade na naponu od 1.5V i sposobni su za frekvenciju od 1250 MHz ili 5 GHz, efektivno), Radeon HD5970 ima instalirane Hynix H5Gq1H24AFR-T2C čipove sa istom specifikacijom (1250 MHz, odnosno maksimalno 5 GHz, efektivno). Radeon HD5970 ima 2 x 1 GB GDDR5 čipova smeštenih sa obe strane PCB-a u vidu čak 16 čipova, po osam na svakoj strani, odnosno po četiri oko svakog GPU-a, sa svake od strana štampane ploče. Na kartici su podešeni na 1000 MHz (4.0 GHz), a pošto znamo da mogu i više, jasno je da Radeon HD5970 ima dosta veliki overkloking potencijal. Štaviše, videćemo da se i AMD dodatno pobrinuo da bude tako.
Plastični poklopac prekriva čitavu površinu PCB-a, a primetno je da se rashladni sistem, po konceptu, nije bitno promenio u odnosu na prethodna Single GPU rešenja. Kuler je nešto složeniji od onog opisanog u testu Radeon HD5870 akceleratora, jer su tu sada dva GPU-a, ali i više VRAM-a. Plastčni poklopac je isto dizajniran, ali je duži, a ispod “haube” uočavamo dosta promena, jer je sve prilagođeno Hemlock layout-u. Iako je u pitanju DualGPU kartica, kuler za Hemlocka je sličniji onom za Cypress nego za Radeon HD4870X2, koji je bio topao i dosta manje efikasan. Naime, ako se sećate našeg opisa tog rashladnog sistema, znate da se on sastoji iz dve odvojene baze za svaki od grafičkih procesora, a da je i dalje postojao samo jedan ventilator koji ih je hladio. Tako je vazduh zagrejan nakon prelaska preko prvog, bližeg heatsink sistema bio veoma neefikasan u hlađenju narednog „radijatora“. Upravo je zbog toga novi kuler sličniji, bar na prvi pogled, prilagođenoj verziji kulera sa Radeon HD5870 akceleratora, što znači da jedan heatsink hladi oba GPU-a! Mesto na kome kuler dodiruje GPU-ove, na njegovim ivicama, posebno je ojačano i precizno obrađeno kako bi bakarni umetak na donjoj strani na najbolji način legao na površinu jezgra. Baza koja dodiruje jezgro i setove memorija je malo masivnija i duža, a takođe je jako dobro ispolirana. Kuler je načinjen od kombinacije metala: baza je od bakra, dok je glavni radijator sa listićima načinjen od aluminijuma. Za bolju distribuciju toplotne energije, ovoga puta nisu korištene heat-pipe cevčice, već je sam heatsink, solidnijih gabarita, povezan sa ogromnim alu-profilom načinjenim od niza listova i smešten u dobro izolovanu komoru kroz koju vazduh vrlo precizno prolazi sve do otvora na kraju kartice. Toplotna energija se predaje vazduhu koji velikom brzinom prolazi kroz tunel i izlazi van kućišta, što je vrlo bitan detalj i što je jedna od osnovnih razlika u odnosu na kulere koji nemaju tako dobro zatvorene tunel-sisteme unutar kojih se nalazi deo koji aktivno rashlađuje komponente. Takođe, dobra toplotna izolacija donosi i benefite na polju akustike, pa je i rashladni sistem na Radeon HD5970 kartici solidno tih. Princip funkcionisanja kulera je ostao isti: ventilator, koji radi na minimalno 1100, a maksimalno 4800 obrtaja u minuti (NTK Technologies FD9238H12S, 12V, 0.8 – 1.0A, promera od 92mm) uvlači hladniji vazduh u tunel u kome se nalaze zagrejani listići koji su preuzeli toplotnu energiju sa baze kulera. Ovakav kuler je sposoban da ohladi čak 400W toplotne disipacije, što je impresivno i skoro za ne poverovati.
Ventilator kod AMD Radeon HD5970 akceleratora je tiši nego što smo očekivali da će biti, osim u slučajevima jačeg overkloking-a, kada se ubrzava (često i ručno, putem recimo MSI AfterBurner softvera, kao što ćete kasnije videti) i do maksimalnih 100%. Ako je pak ne overklokujete, i tokom dužih igračkih sesija, ova velika kartica će ostati solidno tiha u radu. Ono što je, pak, važnije je nešto što smo već nekoliko puta pomenuli, a to je potrošnja u stanju mirovanja koja iznosi impresivnih 54W – što je 2x više u odnosu na Radeon HD5850, ali je, recimo, Single GPU akcelerator iz prethodne generacije, Radeon HD4870, u idle režimu trošio čak 90W. Kao što smo već pisali u prethodnim testovima, ovako niska potrošnja je sada moguća jer RV870 može čak i GDDR5 čipove da stavi u low-power režim, tako bitno smanjujući radne napone i potrošnju memorijskih čipova koji su zbirno jednako veliki potrošači kao i sam GPU.
Kartica je tokom testiranja radila savršeno stabilno, kada gledamo njenu hardversku stranu, međutim, kada su Beta4 i Beta5 drajveri u pitanju – a samo smo takve i imali tokom testiranja – tu nikako ne možemo dati reči hvale. Pored pojedinih bagova koji su nas podsetili na ponašanje upravljačkih programa pod Windows 95 operativnim sistemom, primetili smo i toliko neobične pojave poput one u kojoj se klizač za, recimo, antialiasing sam vraća u 0x poziciju, kada postavimo vrednost na 8x i kliknemo na Apply. Reinstalacija je rešila problem, ali su se kasnije javili neki drugi bagovi, uključujući i pojedine greške u prikazu nekih shadera (object motion blur oružja, npr.) u igrama kakav je Crysis i Crysis Warhead (sa aktuelnim patche-vima) i to u 64-bitnim verzijama tih igara. U drugim igrama, aktiviranje SSAO funkcije je dovodilo i do nekih drugih problema sa osvetljenjem ili geometrijom. Ipak, problemi nisu bili toliko izraženi da je igra postajala neigriva, a i nestajali su nakon promene nekih podešavanja, bilo u samoj aplikaciji ili drajverima. Uostalom, ATI je na svom FTP-u i podvukao da se radi o Beta drajverima, ali i do sada smo uglavnom takve i koristili tokom testiranja i nismo odavno, baš odavno, naišli na ovakve sitne probleme, čak ni kada smo se igrali sa Radeon HD4870X2 ili HD3870X2 modelima (iako sada Crossfire generalno radi bolje nego ranije, bar kad je kompatibilnost i transparentnost njegovog postojanja u pitanju).
Test Setup
PCI Express kartice smo testirali na test sistemu prikazanom u tabeli:
Procesor
Intel Core i7 920 @ 4000 MHz
Matična ploča
ASUS P6T Deluxe OC Palm Edition Intel X58 Chipset
Memorija
3 x 2Gb Geil PC2-16000 2000 MHz @1.65V
Hard Disk
Samsung SpinPoint F1, 320 GB, 16MB Cache
Western Digital Caviar Black 7500 AALS, 750GB, 32MB Cache
Video Karte
NVIDIA GeForce cards tested on ForceWare 195.55 Windows 7 x64
AMD Radeon cards tested on Catalyst 9.11 except Hemlock
for which we used Catalyst 8.663.1 Beta 4 / Beta 5
Monitor
Samsung SyncMaster 244T / 245T
Cooling, Case, PSU
CoolerMaster Hyper Z600
CoolerMaster Cosmos ESA 1010*
CoolerMaster Ultimate Circuit Protection 1100W*
* – ustupio Cooler Master
DVD uređaj
Optiarc DVD Recorder, SATA II
Optički uređaj
Pioneer Blu Ray reader
Operativni sistem
Windows 7 Enterprise Edition 64-bit
Igre/Bench programi
3D Mark Vantage
3D Mark 06
Unigine DirectX 11 Benchmark
SPEC.ORG SpecviewPERF 10
Enemy Territory: Quake Wars
BattleForge
Company of Heroes 1.3
Battlefield 2142
Unreal Tournament 3
Lost Planet: Extreme Conditions
Call of Duty: Modern Warfare 2
Left 4 Dead
Assassin's Creed
Far Cry 2
Crysis Warhead 1.21
Fallout 3
Race Driver: GRID
Need For Speed: ProStreet
Tom Clancy's H.A.W.X
X3: Terran Conflict Benchmark Demo
World in Conflict
S.T.A.L.K.E.R Call of Pripyat Benchmark Demo
Resident Evil 5
FutureMark 3DMark 06 Pro
Pretposlednje izdanje 3DMark benchmarka može da se izvršava samo sa Direct X 9 kompatibilnim akceleratorima. Tri prerađena testa iz verzije “05” koriste Shader Model verzije 2.0, dok najnoviji zahteva SM3.0 i 256 MB video memorije. Sva tri game demoa su izuzetno zahtevna, karakteriše ih još veći broj poligona koji opterećuje VS jedinicu, kompleksni shader programi (mapiranje neravnina, osvetljenja, emulacija pravog HDR osvetljenja, particle efekti, dinamične i meke senke, subface scattering, napredni fog efekti (emulacija volumetric efekta), ali i dosta postprocesing efekata. Novi test – Deep Freeze je grafički najimpresivniji, a novi 3DMark ima i napredni CPU test, koji simulira upotrebu A.I. rutina u igrama, kao i kalkulacije vezane za samu fiziku.
FutureMark 3DMark Vantage
Iako nije toliko vizuelno impresivan kao njegovi prethodnici, 3DMark Vantage je zapravo dosta bolje osmišljen GPU i gaming benchmark uopšte. Pažnja je ovoga puta usmerena na funkcije koje se izvršavaju ili će se uskoro izvršavati unutar igračkih “endžina”, a ne na sam artwork. Prvi od dva grafička testa, Jane Nash (Graphics Test 1) testiraju simulaciju tečnih povšina i generisanih tekstura, kao i GPU-kalkulisane sisteme čestica, a u čitavoj sceni se u realnom vremenu u obzir uzimaju i uticaj gravitacije na objektima (pa i na “objektima” glavne junakinje), zakon inercije i impulsa sile (prva dva Njutnova zakona), kao i zakon akcije i reakcije, uz uticaj otpora vazduha. Fiziku kalkuliše GPU, a da sve ne bi ostalo samo na kalkulacijama “ispod”, 3D scena je opterećena brojnim dinamičkim izvorima osvetljenja sa kompleksnim senkama, a voda, koja je refleksivna i refraktivna, se ne pomera na predefinisan način, već se svaki talas u realnom vremenu i dinamički generiše. Drugi test, New Calico, podseća na igru X3:The Threat i ne sadrži objekte sa skinovima (bez zglobova), ali zato poseduje ogroman broj objekata u sceni, sa shadow mapama različitog tipa. Po prvi put u 3DMark benchmark programu, prisutni su i global raytracing efekti ((Parallax Occlusion Mapping, True Impostors i volumetric fog). Treći test pokušava da izmeri performanse CPU-a u kalkulacijama veštačke inteligencije i fizike. Broj “gejtova” kroz koje proleću avioni je srazmeran broju jezgara sistemskog procesora, a ako u sistemu posedujete i hardver za kalkulaciju fizike (PPU), ovaj broj se povećava za tri. Nakon, standardnih, na red dolaze i “sintetički” testovi: texture fillrate, color fillrate, paralax occlusion mapping, gpu clothing, particles, noise…
Unigine DirectX 11 Heaven Benchmark
Kompanije Unigine je predstavila svoj prvi DirectX 11 benchmark pod nazivom “Heaven”, koji koristi sopstveni 3D rendering engine, koji ima codepath za izvršavanje pod OpenGL, DirectX 9, 10 i 11 verzijama API-ja. Demo izgleda u najmanju ruku impresivno, te za sobom ubedljivo ostavlja sve što je FutureMark uradio u poslednjih nekoliko izdanja svojih benchmark programa. Kao i većina prvih DirectX 11 benchmark programa i igara, i “Heaven” u DX11 modu podržava i žestoko se oslanja na hardverski tesselation za prikaz izuzetno detaljnih površina na objektima, kao i naprednu implementaciju screen-space ambient occlusion (SSAO) tehnologije. Pored svega, tu su i volumetrijski efekti za prikaz detaljnih, realističnih oblaka. Posebno je interesantna opcija walk ili fly through, pa nam je izuzetno žao što ovaj demo nikad nije prerastao u neku igru. Mi smo koristili DirectX 11 verziju, uz 8xAA i 16xAF filtere.
SpecORG SPECviewperf 10
Koristili smo nešto stariju, ali stabilnu verziju koji se sastoji od čak osam celina. SpecviewPerf meri performanse sistema pod OpenGL API-jem tako što simulira osam standardnih industrijskih aplikacija. 3Dsmax-03 je baziran na SPECapc za 3dS MAX u OpenGL okruženju. U sceni su tri modela sastavljena od po približno 1.5 miliona vertices-a, a testiranje se vrši uz nekoliko tipičnih tipova osvetljenja. Catia-01 je bazirana na Dassault CATIA inžinjering aplikaciji u kojoj modeli imaju do dva miliona osnovnih linija. Ensight-01 je simulacija CEI EnSight inžinjering aplikacije koja se koristi za vizuelizaciju. U test su ubačeni displej-list i fast preview modovi rada. Umesto Lightscape aplikacije , tu je sada TeamCenter Visualisation (tcvis-01), a Maya-02, kako joj i samo ime govori, simulira radno okruženje paketa kompanije Alias – Maya 7, nezamenljivi alat filmadžija u Holivudu. Proe-04 je baziran na SPECapc okruženju za Pro-Engineer 2001, koji u sceni primenjuje dva modela u tri shade moda (senčeni, wireframe i hidden-line removal). SW-02 simulira Solidworks 2008 aplikaciju, koju izdaje Dassault Systems i konačno, test Ugnx-01, baziran na SPECapc Unigraphics aplikaciji, u kojem je prikazan model motora SUV automobila sastavljen od više desetina miliona osnovnih linija. SPECviewperf 10 je znatno znatno zahtevniji od ranije korištene verzije 8.1. Pogledajmo rezultate:
Lost Planet: Extreme Condition
Lost Planet: Extreme Condition je za Xbox360 izašao početkom 2007 godine, a nešto više od godinu dana kasnije, pojavio se i u verziji za Windows XP i Vista platformu sa podrškom za rad kroz DirectX 9 i DirectX 10 API-je. Kao i u verziji za Xbox360, poseduje veliki broj “next-gen” efekata, uključujući i filmske efekte poput full-frame motion blur-a, depth of field-a, a posebno se ističu napredni particle efekti koji verno oslikavaju žestoke zimske uslove, vatru, paljbu iz futurističkog oružja i sl. Na Microsoft konzoli radi u 720p rezoluciji sa oko 30-35 fps, ali kako podržava više radne rezolucije na Windows platformi (rezolucije tekstura, poligoni i sl. su identični Xbox360 verziji), predstavlja dosta dobar alat za testiranje novih grafičkih kartica. Iako gotovo tri godine nakon što je završena, igra po današnjim standardima ne izgleda impresivno, ume da bude prilično zahtevna. Mi smo testirali kroz prvi “built-in” test, uz maksimalan nivo detalja, u DirectX10 okruženju pa pogledajmo rezultate:
Call of Duty: Modern Warfare 2
Call of Duty: Modern Warfare 2 je sledeća u nizu modernih arkadnih simulacija građanskih ratova i drugih političkih i verskih okršaja širom planete zemlje. Baziran je na unapređenom “motoru” svojih prethodnika, posebno verzija World at War i Modern Warfare. Broj detalja odnosno dešavanja u sceni u svakom trenutku je izuzetno veliki, bilo da su u pitanju sitnice poput mapiranja neravnina, bloom i HDR efekti, dinamičke senke i osvetljenja, efekti eksplozija i dima ili sveprisutni depth-of-field tokom zumiranja. U igri svaki metak prolazi kroz materijale kroz koje bi prošao i u realnoj borbi (drvo, staklo, tanak metal), uz adekvatno usporenje i izmenu pravca. Igra koristi DirectX 9.0 i DirectX 10, a mi smo, naravno, testirali sa najvišim brojem detalja. Pogledajmo rezultate:
Enemy Territory: Quake Wars
Multiplayer igra u Quake univerzumu, koja cilja publiku “navučenu” na Battlefield, Team Fortress i Unreal Tournament, zapravo je svojevrsni prequel Quake-a II i njena radnja je smeštena na Zemlju, u sred sukoba Strogg-ova i ljudi. Novi Doom 3 MegaTexture engine u ETQW je negde na pola puta do pravog naslova sledeće generacije (koji ćemo u različitim verzijama videti u igrama Doom 4 i Rage), ali je princip rada identičan. Engine se oslanja na OpenGL i baziran je na mapiranju terena i svih objekata jednom mega-teksturom koja se direktno “ucrtava” na geometriju. Ova pametna, gigantska tekstura objektima daje i svojstva, što developerima igara daje puno slobode pri kreiranju ogromnih, detaljnih terena i vrlo unikatnih objekata (teksture se ne ponavljaju). Iako prva Doom 3 MT igra ne izgleda toliko impresivno (Crysis je ipak postavio neke standarde isuviše visoko), vrlo je dobro optimizovana. Testirali smo, naravno, na maksimalnom nivou detalja…
Resident Evil 5 benchmark
Ova survival horror igra je inicijalno razvijena za Xbox 360 i PlayStation 3, a nedavno se pojavio i Benchmark Demo za PC, ali i kompletna igra. Razvojni tim Capcom stoji iza naslova kakvi su Lost Planet i serijal Onimusha, pa je jasno da je grafička prezentacija na visokom nivou, a posebne reči hvale se mogu uputiti za optimizaciju, jer je ova igra, kao jedna od najlepših akcionih arkadnih igara ovog tipa na PC plaformi istovremeno i jedna od najmanje zahtevnih. Engine se oslanja uglavnom na funkcije DirectX 9.0c API-ja, mada igra zvanično podržava DirectX 10, ali ne koristi njegove napredne mogućnosti. Na PC platformi, igra podržava i GeForce 3D vision sistem naočara koji omogućava dublji “immersion” u samu igru. U benchmark demou, koji je izašao mesecima pre same igre, sva podešavanja smo postavili na maksimum i testirali sa i bez anisotropic i antialiasing filtera. Testirali smo DirectX 10 verziju. Pogledajmo rezultate:
X3: Terran Conflict
Nastavak, odnosno ekspanzija čuvene igre X3: Reunion, Terran Conflict je igra koja vam omogućava da iskusite život u svemiru, u dalekoj budućnosti. Možete graditi, trgovati, boriti se ili biti samo istraživač. Igra je inicijalno posedovala fenomenalnu grafiku, a kako je Terran Conflict urađen oko istog “endžina”, ona danas ne izgleda toliko impresivno, iako je i dalje vizuelno vrlo atkrativna. Modeli brodova su bogato dizajnirani, raznovrsni i po tipu, i po veličini i po ulozi koju imaju, sa velikim brojem poligona (često preko pola miliona po sceni) , opskrbljeni fantastičnim color i displacement (bump) teksturama. Okolina (sam svemir, planete, asteroidi, magline…) i bogati particle efekti doprinose utisku, a zahtevnost igre je povećana kompleksnijim modelima brodova i većim brojem asteroida u poređenju sa prethodnom igrom, zbog čega smo Terran Conlict Benchmark demo uvrstili kao standardan deo naše test palete.
Company of Heroes 1.3
Prva real-time strategija u našem test-suite-u, Company of Heroes, koristi posebni next-gen engine koji Relic naziva “Essence Engine”. Ovaj engine podr žava sve nove fancy efekte kao što su High Dynamic Range i dinamičko osvetljenje, per-pixel senke, a displacement (normal) mapping je vidljiv na mnogim objektima. Takođe, igra se obilato oslanja na napredne shader rutine, ali i licenciranu Havoc fiziku, a pojedini objekti su destruktabilni, što donekle važi i za teren. Kao i obično, u igri smo uključili sve moguće efekte, što se po frame-rate-u i vidi:
World in Conflict
Druga real-time strategija u našem test-suite-u, World in Conflict, verovatno je i dalje najimpresivnija RTS igra koja je izašla na PC tržište. Bazirana je na novom Direct3D “endžinu” koji podržava čitav spisak novih efekata kakve smo do sada viđali samo u, po pravilu najinovativnijim FPS igrama. Dakle, tu su HDR, bloom i dinamičko osvetljenje, per-pixel senke, destruktabilni teren i adekvatni view-sight, paralax i normal mapping, depth of field i čitav niz drugih filmskih postprocessing efekata . Naravno, mi smo testirali sa maksimalnim nivoom detalja:
BattleForge
Umesto serijala BattleField i njegovih brojnih nastavaka, ovoga puta smo se odlučili da koristimo nešto adekvatniju igru za merenje performansi modernih grafičkih akceleratora. U pitanju je BattleForge, igra koju je razvio Phenomic, koji je zaslužan i za fenomenalni Spellforce RTS-RPG serijal igara. Igra je, kao i njeni prethodnici u svoje vreme, izuzetno napredna i atraktivna, a oslanja se na DirectX 10.1, što donosi i podršku za osnovnu verziju SSAO. Unutar igre postoji i benchmark demo, koji je prilično zahtevan, čak i za ono što ćete tokom igranja iste igre iskusiti (ako se neko seća Quake III Crusher demoa, zna na šta mislimo), jer je u sceni fenomenalan broj jedinica sa puno detalja, detaljne teksture, povremeni normal mapping, parallax mapping, dinamičko osvetljenje i senke, pomenuti SSAO, te post processing efekti. Igru smo testirali na najvišim setovanjima:
Unreal Tournament 3
Unreal Engine 3 je najpopularniji “motor” koji koristi tj. radi putem poslednje tri iteracije DirectX API-ja i pored CryEngine 2, predstavlja trenutni “vrh ponude” kad je igračka industrija u pitanju. Nema potrebe da nabrajamo šta sve podržava, samo ćemo pomenuti neke prelepe naslove koje ste verovatno već videli ili igrali: Bioshock, Rainbow Six: Vegas 2, Medal of Honor: Airborne, Gears of War 2, Mass Effect, Stranglehold i plejada drugih igara koje su već izašle u verzijama za Xbox 360 ili su u najavi. Demo Unreal Tournament 3 igre ne omogućava maksimalan već samo visok nivo detalja kad su u pitanju teksture, međutim, i ovo je dovoljno zahtevno da i najnovije grafičke kartice stavi na muke. Novija verzija igre pod DirectX 10 API-jem podržava i antialiasing, koji ranije nije bio moguć…
Assassin's Creed
Smeštena u vreme Templata, u drevni Jerusalim (ali zapravo i u blisku budućnost), igra Assassin's Creed je akciona igra sa elementima šunjalice, koja se izvodi iz trećeg lica. Pokreće je revolucionarni engine koji je razvijan za konzole aktuelne generacije (Xbox360 i PS3), ali tek na PC-ju pokazuje koliko zaista može, jer može da radi u značajno višoj rezoluciji od one koja je za konzole standardna (1280 x 720 piksela). Igra koristi sve napredne shader tehnike koje možete videti u najmodernijim igrama kakav je, recimo Crysis, a još uvek spada u jednu od najlepših igara koje se mogu igrati na PC platformi. Mi smo testirali na najvišem mogućem nivou detalja, u DirectX 10.0 režimu, bez patch-a za DirectX 10.1 i narednog, koji ga je poništio.
Far Cry 2 Benchmark
Nastavak jedne od najimpresivnijih igara svog vremena, fenomenalnog FarCry-a, koristi posebno razvijani Dunia Engine. Ovaj engine podržava sve moderne efekte DirectX 9.0c API-ja za prikaz grafike, ali i napredne mogućnosti kao što su destruktivni teren i objekti, dinamičko širenje vatre u odnosu na vremenske uslove i vetar, specijalne atmosferske efekte (realne simulacije oluje), izmene dana i noći, napredni ne-skriptovani A.I. Engine podržava DirectX 9.0c, ali i DirectX 10, a posebna pažnja pri njegovom razvoju poklonjena je optimizaciji za Xenos GPU na Xbox 360 konzoli. Generalno, Dunia Engine implementiran u Far Cry 2 jeste manje grafički zahtevan of Cry Engine 2 “motora” koji se koristi u igrama Crysis i Crysis Warhead. Mi smo koristili maksimalan nivo detalja, plus dodatnu modifikaciju za dalje iscrtavanje detaljnijih objekata (povećan ukupan LOD) i kompletne 3D vegetacije na daljim udaljenostima od “kamere”.
Crysis Warhead
Šta reći o najdetaljnijoj, grafički najimpresivnijoj igri i najzahtevnijoj igri današnjice – Crysis – ili o njenoj kraćoj, ali još intenzivnijoj stand-alone ekspanziji – Crysis Warhead?. U odnosu na bilo koju drugu igru koja vam može pasti na pamet – Crysis uz najviša setovanja izgleda bar za dva koplja iznad, što je iznenađujuće za naslov koji puni svoju treću godinu postojanja na tržištu. Tokom testiranja smo koristili Ultra Quality Screenshot Config podešavanja aktuelnog CCC mod-a (bez Time of Day modifikacije), koji omogućava još veću daljinu iscrtavanja, veći broj dinamičkih osvetljenja i senki, precizniji enviroinment mapping i refleksije. Osim toga, vredi napomenuti da je u pitanju apdejtovana, 1.21 verzija igre koja je donela i 64-bitni Crysis.exe fajl, pa je tako i Crysis Warhead testiran pod DX10/Windows 7 okruženjem, naravno, baš sa ovom verzijom same aplikacije.
Left 4 Dead
Nama veoma drag serijal Half Life, zamenili smo modernijom i intenzivnijom surival-horor akcionom igrom, koja poseduje ugrađeni benchmark demo. Left 4 Dead je poslednji hit iz Valve radionice, izrađen oko poboljšane verzije Source 2.0 endžina, korištenog u poslednjoj HL2 Episode 2 igri. Igra je smeštena u apokaliptičnu blisku budućnost, nakon pandemije virusa koji je veći deo planete pretvorio u zombije na stereoidima, dok je deo preživelih ostavio da rade upravo to – preživljavaju. Igra je najzanimljivija u kooperativnom multiplejer režimu, koji se može igrati kao versus mod (slično deathmatchu) ili kao co-op kampanja. Poboljšanja na Source “motoru” obuhvataju bolju podršku za višejezgarne procesore, animacija koja se oslanja na integrisani fizički endžin, prilično je dorađen i AI, a dodate su i novine koje nismo viđali u Half Life igrama, kakvi su self-shadowing, normal mapping i veliki broj post-processing trikova koje Valve objedinjuje pod nazivom cinematic visual effects (color contrast, sharpening, multi-focusing, film grain, vignetting itd.). Pogledajmo rezultate koje smo postigli uz najviši nivo detalja.
S.T.A.L.K.E.R: Call of Pripyat
Nakon izlaska naslova S.T.A.L.K.E.R.: Shadow of Chernobyl i Clear Sky, ukrajinski razvojni tim GSC Game World se ponovo okušao u oživljavanju Zone, kroz poslednje izdanje iz serijala: Call of Pripyat Clear Sky. Ovoga puta, kontaminirana teritorija pod nazivom Zona izgleda još impresivnije nego ranije, jer nova verzija engine-a podržava neke od najnaprednijih i najzanimljivijih DirectX 11 specijaliteta. Pored mnogobrojnih novih i starih efekata poput smene dana i noći, realističnih sunčevih zraka, kiše, munja, mokrih materijala, tu su sada i impresivni High Definition Ambient Occlusion (HDAO), zatim realističniji modeli zahvaljujući hardverskoj podršci za Tesselated Game Characters, ali i posebni DX11 Contact Hardening Shadows. HDAO omogućava da ambijentalna svetlost realistično prodre i do prostora u kome nema direktnog izvora svetlosti, te rasipa baš kao i u realnom svetu, ali bez implementacije zahtevnih radiosity senčenja. Uz per-sub-pixel preciznost izvršavanja shader rutina, “Zona” nikad nije izgledala realnije. Mi smo koristili demo koji je posebno kreiran samo za testiranje performansi grafičkog podsistema.
Fallout 3
Fallout 3 je fantastični post-apokaliptični RPG smešten u 2277 godinu, nakon dešavanja iz prethodne dve igre. Kao i The Elder Scrolls IV: Oblivion, igra koju smo (na ovom mestu) ranije koristili za merenje performansi grafičkih kartica, Fallout 3 je nelinearna role-play igra sa izvođenjem iz trećeg lica, koja po mnogim stvarima podseća na “Oblivion”, a i bazirana je na istom “Gamebryo” endžinu. Njegova implementacija u tri godine novijoj igri izgleda daleko bolje, pa se u Falloutu 3 ne dešava da određena stena ili drvo “iskoče” dok se krećete kroz razrušenu pustoš nekadašnje Virdžinije (okolina Vašingtona). Grafika je na PC računarima, uz “Ultra” preset, na momente zaista fascinantna, a treba imati u vidu da se radi o prostoru koji je veći i od onog u Crysis ili FarCry igrama, kao i da je Fallout 3 manje zahtevna igra od pomenutih. Fallout 3, kao ni Oblivion, nemaju ugrađeni “benchmark” program, niti bilo kakvu vrstu time-demo, pa je neophodno napraviti walkthrough sa iste lokacije i to ponoviti tri puta. Svaka od tri vožnje je merena Fraps-om, zabeleženi su srednji rezultati, a u rezultatima prikazujemo prosečni fps. Naravno, koristili smo najviši nivo detalja koji je moguće postići iz same igre, kao i dodatni HD texture mod, koji se besplatno može preuzeti sa velikog broja mod-foruma.
Race Driver: GRID
Ljubitelji Codemastersovih igara, odnosno arkadnih vožnji koje ipak poštuju nekakve zakone fizike (za razliku od igara iz Need For Speed serijala), s nestrpljenjem su dočekali igru u kojoj igrač učestvuje u standardnim uličnim trkama. Potpuno drugačije koncipiran od odličnog Colin McRae DIRT naslova, GRID koristi unapređenu verziju Neon endžina, koji Codemasters naziva Ego Engine, a koji donosi realističniji “damage model”, preciznije osvetljenje i sistem senki, a usput je dosta bolje optimizovan od prethodnika. Igra je inicijalno razvijana za Xbox360, ali ne treba očekivati viši nivo detalja u odnosu na CMR: DIRT – iako su staze znatno bogatije okolnim objektima (trke se odvijaju u gradovima), isti imaju nešto manji broj detalja, iako sama igra, nakon primene modernih motion blur, bloom, HDR i drugih post-processing efekata, izgleda zaista dobro. Na PC platformi postoje različite modifikacije za poboljšanje grafike, koje mi ovoga puta nismo koristili – standardno, sve smo povećali na maksimum. Pogledajmo rezultate:
Need For Speed: Shift
Nova generacija čuvenog racing serijala Need For Speed, sada koristi još unapređeni “engine” za prikaz grafike, ali i nešto manje arkadni fizički model, preuzet iz igre Ferrari Project, što se većini dopalo posle manje uspešnih nastavaka ProStreet i Underground. Ovaj multiplatformski naslov je isprva bio pomalo problematičan za PC, ali smo ubrzo nakon što je izašao uspeli da ga “dovedemo u red” i nateramo da jednako dobro radi na ATI i NVIDIA karticama. Znatno je grafički poboljšana u odnosu na prethodnike, a modeli automobila i okolinih objekata su realističniji, bez nepotrebnih šljaštećih efekata i uz realističan prikaz enterijera (koji nije postojao u NFS serijalu još od naslova Porsche Unleashed iz 2000. godine). Motion blur je daleko suptilniji nego ranije, a dodat je i prilično atraktivan dinamički efekat koji dočarava neudobnost sportskih automobila. Teksture su detaljnije, broj animiranih objekata znatno veći, a particle efekti, a posebno dim, značajno su upečatljiviji. Depth of Field i HDR su standardna pojava, a dizajneri igre tvrde i da su i oblaci volumetrijski.
Tom Clancy's H.A.W.X.
H.A.W.X je borbena avio simulacija arkadnog tipa, koja poseduje i priču koju je osmislio čuveni američki pisac Tom Clancy, direktni krivac za veliki uspeh hit serijala kakvi su Rainbow Six, Ghost Recon, Splinter Cell i EndWar. Radnja koja prati tok igre, prepliće se upravo sa naslovima Tom Clancy's Ghost Recon Advanced Warfighter 1 i 2, kao i RTS igrom EndWar. H.A.W.X poseduje dva moda – safe (ERS) i advanced (ERS off), pri čemu je ovaj drugi i vizuelno dosta atraktivniji, ali i za nijansu realniji (avioni dosta lakše padaju u kovitlac). Ipak, treba znati da igra predstavlja najčistiju moguću arkadu, jer sa avionima ne možete nigde sleteti, ali ni usporiti ispod 900 km/h, čak ni sa onim koji to u realnosti mogu (npr. Sea Harrier britanske mornarice). Modeli aviona su vrlo detaljni, a teksture i okolina skoro foto-realistični (korištene su GeoEye Earth-imaging IKONOS mape). Sama igra je prilično dobro optimizovana, pogotovo ako je pokrenete u DirectX 10.1 modu (na odgovarajućoj kartici, naravno), a mi smo testirali na najvišem nivou detalja.
Overclocking
Ne samo da je ATI otključao bios svojih Radeon HD5970 kartica za overkloking (ne postoji limit cap u Overdrive panelu), već nam je poslao i over-volting tool. Pošto je isti nudio samo dva nivoa za podešavanje napona memorije i GPU-ova, mi smo se odlučili za novu verziju MSI AfterBurner softvera, koji je u verziji objavljenoj par dana pre zvaničnog predstavljanja Radeon HD5970, već imao podršku za Hemlock. Ovoga puta, ostavićemo da slike govore… a onda idu i rezultati.
Zaključak
Kao i više puta u poslednjih nekoliko testova novih AMD Radeon grafičkih akceleratora najviše klase, na kraju imamo uglavnom reči hvale. I ponovo moramo da napišemo onu, sada već poznatu: AMD Radeon [HD5970] je najbrži akcelerator koji možete kupiti. Naravno, to ste već znali ako ste došli do ove stranice, pa je potrebno da vam kažemo i nešto više. Ovakve rezultate smo zaista i očekivali, s obzirom na to da je Radeon HD5870 već prilično impresirao svojim performansama navodivši nas da zaključimo da i 1.5x bolje, ne može nikako da bude loše. Ne samo da je brži od prethodne generacije Radeon kartica sa dva GPU-a, već je brži i od prethodne generacije DualGPU kartica iz konkurencije, što smo takođe uspeli da proverimo i sami (doduše, uz utrošak nešto više vremena – trebalo je pronaći slobodnu GeForce GTX295 karticu, što nije bio lak zadatak). Istina, sasvim je bilo logično da ovu karticu uporedimo sa i dalje aktuelnim dvoglavim GeForce-om, ali iskreno, ta kartica nije ništa više nego GeForce GTX275 u SLI režimu, a znamo koliko je od nje brži jedan Radeon HD5870. Uz malo matematike, svi će doći do logičnih zaključaka. Čemu onda čitav ovaj rezime – stvar je vrlo prosta: ako imate mogućnosti i želje za nečim što je strahovito brzo i moćno, svakako bi trebalo da se uhvatite za prvu Radeon HD5970 karticu koju pronađete u prodaji. Pre toga, svakako, proverite hoće li ona moći da stane u vaše kućište, kao i da li će vaše napajanje to sve podneti – 340 milimetara i barem 700 zdravih W su brojke koje ne bi trebalo da smetnete sa uma. Da li sve to možemo uzeti kao mane? Njene dimenzije i masu? Ne, ako imamo malo znanja o limitima aktuelne litografije, ako znamo nešto malo o termodinamici i imamo, uz sve to i nešto malo zdravog razuma. Spakovati ovako kompleksne čipove sa svom pratećom elektronikom i sistemima za napajanje, te impresivnim rashladnim sistemom čak i na prostor koji kartica zauzima je dovoljno impresivno. Uz sve to, ona je i prilično dobar overkloker, zbog čega joj i pripada nagrada koju ispod vidite.
AMD Radeon HD5970 – Benchmark Extreme Overclocker Award
Cena ove kartice je razumna za ono što ona nudi, iako će mnogi kupci tvrditi da je bolje da sebi nabave dve Radeon HD5870 ili čak HD5850 kartice i postave ih u CrossFire režim rada. Istina je da je ovakav setup fleksibilnije rešenje, a i DualGPU kartica prethodne generacije se uvek teže prodaje od njenog adekvatnog SingleGPU brata, o čemu korisnici PC računara sve češće razmišljaju kada se odlučuju za kupovinu hardvera nove generacije. ATI Radeon HD5970, osim izuzetnih performansi, o kojima stalno pričamo, pruža i sve prednosti AMD-ove Evergreen tehnologije, među kojima su, na prvom mestu svakako podrška za DirectX 11 i DirectCompute 11, te viši kvalitet antialiasing-a i anisotropic/triliear filtera, izuzetno niska potrošnja u stanju mirovanja te EyeFinity i mogućnost igranja u suludo visokim rezolucijama. Ako kojim slučajem budete u prilici da nabavite dve ovakve kartice za CrossFire X, verujemo da bi čak i Crysis Warhead radio dovoljno brzo u frapantnom modu od 7680 x 1600 piksela. Zamislite samo koliko bi brzo vaš mozak radio kada biste igrali neku zahtevnu real-time strategiju u ovoj rezoluciji (znamo nekoliko ljudi kojima će EyeFinity postati vrlo zanimljiv kada se pojavi Starcraft 3).
Slične zaključke su, za svoju cenovnu klasu, dobili i Radeon HD5870 i HD5850 akceleratori. Tako mi trenutno svakom igraču, u klasama od 230 i 330 evra trenutno preporučili neko od izdanja baziranih na ATI Radeon HD5850, odnosno HD5870 akceleratorima. Kada je još viša klasa u pitanju – ako vam mogućnosti dozvoljavaju, a srce kaže da je to prava stvar – slobodno se odlučite za Radeon HD5970. I mi smo sigurni da su dva Radeona HD5870 možda rentabilnije rešenje, ali i DualGPU solucija, koja je sama po sebi i ovoga puta za bar dve nijanse veći masterpiece od pomenute SingleGPU verzije, sigurno ima svojih draži. Jedna od konkretnih prednosti je i to što je otključana za overkloking, a AMD vas čak i ohrabruje da se poigrate i sa blagim povećavanjem voltaže. Ako budete strpljivi, videćete da Radeon HD5970 tek može da vas iznenadi, kao što je iznenadio i nas tokom testiranja. Istina, sve će tada biti nešto bučnije, ali svako povećanje performansi ima svoju cenu. Iskreno, bilo nam je jako žao što smo ovu karticu morali da vratimo nakon testiranja, ali to je slučaj sa svakim dobrim parčetom hardvera koji se testira. Ipak, ovoga puta, imali smo potrebu da to i pomenemo…
AMD Radeon HD5970 na test ustupio AMD.