AMD Radeon HD6990

AMD Radeon HD6990

Radeon HD5970 je jako dugo bila najbrža grafička kartica koja se može kupiti, baš kao što je i GeForce GTX 480 dugo bio najbrža Single GPU kartica. AMD sada želi da odbrani poziciju i zadrži postojeću titulu. Potrebno je opet biti najbrži, a s obzirom na to da je Cayman najmoćniji GPU koji AMD ima, logično je da će za enthusiast klasu morati da upotrebi dva takva čipa i 4 GB brze GDDR5 memorije. Iako je Radeon HD6970 ugl

    Sadržaj

      Branko Maksimović

      Test: AMD Radeon HD6990

      Cayman je AMD-ov novi grafički procesor koji “pogoni” tzv. enthusiast seriju kartica – Radeon HD6900, odnosno modele Radeon HD6950 (Cayman Pro), Radeon HD6970 (Cayman XT), ali i karticu koju danas predstavljamo – Radeon HD6990 (Dual Cayman, odnosno Antilles). Pozicioniranje u odnosu na konkurenciju, AMD je i ovoga puta odradio vrlo lukavo, a “bios flash” deo priče vezane za Radeon HD6950 – HD6970 je, u tom smo sigurni, izbacivanje dodatnog “keca iz rukava”. Radeon HD6970 je cenovno pozicioniran prema slabijem Fermi 2 akceleratoru – GeForce GTX 570 modelu. Sa preporučenom cenom od oko 370 dolara, odnosno 350-360 evra na našem tržištu ova dva akceleratora i po ceni, ali i performansama stoje rame uz rame. Ipak, kako Radeon HD6950 ima PMC od 299 dolara, odnosno oko 270 evra na našem tržištu (što ga svrstava u klasu između starih GTX 470 i GTX 480 modela), ovaj model predstavlja odličnu kupovinu, pogotovo sada kad se zna da ga je moguće “unaprediti” u Radeon HD6970. Upravo su nam stigle i jeftinije verzije Radeon HD6900 kartica sa jednim gigabajtom GDDR5 memorije, koje će, sasvim logično, biti i jeftinije (i koje su pravi naslednici Radeon HD5830 modela). Ovim modelima, AMD želi da parira različitim izdanjima GeForce GTX 560 Ti kartica.
       

      Priču o AMD-ovom Sweet Spot-u i strategiji kreiranja ne-monolitnog čipa svi već dobro znamo. Dual GPU kartice nisu nikakva novost, jer postoje još i pre nego što se pojavio Radeon brend. Zanimljivo je da se i Dual GPU Radeon kartice već mogu pohvaliti solidnim “stažom” – dva grafička akceleratora na jednom PCB-u odnosno jednoj kartici je ideja koja je realizovana odmah nakon što se Crossfire pokazao kao uspešan koncept. A od kako se primenjuje Sweet Spot, Crossfire-on-board je postao i nezaobilazni deo čitavog koncepta koji kaže da se prvo kreira performance čip koji će obezbediti “pogon” za najisplativije klase kartica, a onda i manji derivati za niže klase, dok se za višu klasu pravi Dual GPU rešenje koje je isplativije od rešenja koje podrazumeva kreiranje monolitnog čipa sa nekoliko milijardi tranzistora.
       

      Radeon HD5970 je jako dugo bila najbrža grafička kartica koja se može kupiti, baš kao što je i GeForce GTX 480 dugo bio najbrža Single GPU kartica. AMD sada želi da odbrani poziciju i zadrži postojeću titulu. Potrebno je opet biti najbrži, a pošto je Cayman najbrži čip koji AMD ima, jasno je da će za enthusiast klasu morati da upotrebe dva takva čipa, s obzirom na to da je Radeon HD6970 uglavnom sporiji i od GeForce GTX 570 akceleratora i da nikako ne može da parira najbržem GeForce GTX 580. Pošto se radi o već poznatom grafičkom čipu, podsetićemo se još jednom, ukratko, najvažnijih detalja vezanih za Cayman arhitekturu…


       

      AMD Cayman – osnovne informacije

      Cayman GPU je, dakle, pravi naslednik Cypress modela, pa se od njega i očekuju više performanse u klasi koju su Radeon HD5850 i HD5870 modeli zauzimali kada su se prvi put pojavili na tržištu. Radeon HD6970 je, trenutno, najjači Single GPU akcelerator koji AMD ima u ponudi, a prva stvar koju će svako uočiti kada pogleda specifikacije je činjenica da Cayman ima manji broj shader jedinica i jednak broj ROP (render back-end) unit-a. S druge strane, novi GPU ima dual SIMD jedinice, pojačanu TMU (texture management unit) sekciju, kao i čitava dva gigabajta ultra-brze GDDR5 memorije.
       

      Kompanija koja proizvodi grafičke procesore za AMD i NVIDIA-u se i predugo zadržala na 40-nm procesu, što je stvorilo dosta problema za nekadašnje planove koje su, nesumnjivo, imala oba ova GPU dizajnera. AMD je izmenio sopstvene planove tako što je skalirao Cypress GPU i kreirao Barts sa optimizovanom Evergreen arhitekturom i iskoristio sazrelost 40-nm procesa da postigne iste ili slične performanse sa manjim čipom, koji će se, logično, prodavati po nižoj ceni. Tako je nastala Radeon HD6800 serija, dok je HD5700 serija zadržana iz prethodne generacije (i AMD se nije odlučio da joj promeni oznaku i rebrendira je, što je omražena praksa konkurentskog proizvođača). Videvši da će se još neko vreme zadržati u 40-nm “dvorištu”, AMD je odlučio da “isproba” i nešto noviju (ili bar drugačiju) arhitekturu i kreira Cayman – GPU koji nije mnogo veći od Cypress-a, ali koji je znatno efikasniji u igrama. Cayman je trebalo da bude 32-nm čip, ali ga je AMD kreirao u sada već sazrelom 40-nm procesu, iako smo u razgovoru sa Erikom Demersom saznali da je ova odluka ipak koštala Cayman “nekih zanimljivih funkcija”. Osim nekih stvari o kojima se pričalo ranije, a to je broj shader jedinica koji se kretao oko cifre od 2000, nešto složenijeg (većeg) memorijskog kontrolera i kompatibilnosti sa PCI Express 3.0 logikom, sve ostale priče su čista spekulacija. Zato ni mi sa sigurnošću ne možemo da kažemo da li se radi o funkcionalnim celinama koji se čuvaju sa 28-nm die-shrink (Radeon HD7900) Caymana ili pak količini shader jedinica, a možda i zato GPU koji danas predstavljamo na papiru i ne nudi (mnogo) veću processing moć od Cypress-a. Ipak, videćemo da su u igrama Radeon HD6900 kartice daleko brže od Radeon HD5800 modela. 

      Ako pogledamo grafikon iznad, verujemo da će mnogi pomisliti da dosta liči na Cypress i Barts. Istina, organizacija blokova i jedinica je ostala veoma slična, ali su najveće promene napravljene na nivou svake od tih jedinica. Neke su dosta izmenjene, a neke samo onoliko koliko je bilo potrebno. Ipak, svaka od njih je sada dosta efikasnija u onome što radi.
       

      Površina GPU-a je 389 kvadratnih milimetara, što ga više ne svrstava u rang malih čipova, ali je ipak znatno manji od GF100 ili čak GF110. Po površini se približio omraženom R600 GPU-u, poslednjem monolitnom čipu kompanije ATI (pre nego što ih je AMD uzeo pod svoje i, na svu sreću, primenio novu poslovnu strategiju). Cayman GPU ima 500 miliona tranzistora više od Cypress-a – čak 2.64 milijarde, što je za 29% više, dok je površina GPU-a svega 16% veća.

      Dual Engine

      Cayman-ov layout, kao što smo rekli, podseća na one već viđene kod Barts-a i Cypress-a. GPU ima ukupno 24 SIMD-a u raspoređena u dva odvojena “jezgra” ili bloka. Svaki SIMD ima sopstvenu teksturnu jedinicu, kao i posvećenu L1 texture cache jedinicu. Tu su i četiri 64-bitna memorijska kontrolera, svaki sa sopstvenom L2 keš memorijom i dva render back-end unit-a. Cypress arhitektura podrazumeva jedan command procesor, jedan unificirani grafički “engine” i jednu Ultra Threaded Dispatch jedinicu koja raspoređuje thread-ove u SIMD engine, koji obuhvata shader, TMU i L1 cache jedinice. Cayman i dalje ima jedan osnovni command processor, ali su pomenute jedinice koje čine Single Instruction Multiple Dataengine, podeljene u dva SIMD bloka, a svakoj je dodeljena poseban Ultra Threaded Dispatch Processor. Ovom podelom u arhktekturi, kreiranjem dva unified graphics engine-a, kao i dupliranjem keš i dispatch jedinica, omogućena je obrada dve različite primitive po kloku, povećana efikasnost tessellator jedinica, ubrzano procesiranje geometrije (vertexpodataka) i efikasnije pozivanje dispatch jedinice. Samo razdvajanje rasterizatora omogućilo je procesiranje do 30 piksela po kloku. Dual Rasterizers sada podrazumevaju i postojanje dve odvojene, specijalizovane fixed functionjedinice. Cypress je, kao što smo rekli, imao jedan unified graphics engine i jedan ultra threaded dispatch procesor, dok je Barts bio “na pola puta” ka Cayman dizajnu – imao je jedan unified graphics engine, ali i odvojene ultra threaded dispatchjedinice za svaki SIMD blok. Na ovoj stranici možete pogledati blok dijagram za Barts i Cypress, kao i objašnjenje u čemu se razlikuju.
       

      VLIW4 – jednostavnije je bolje

      Kao što znamo, VLIW5 arhitektura podrazumeva SIMD jedinicu koja je kontrolisana putem komande koja se naziva very long instruction word, a koja može da obuhvati šest instukcija – pet matematičkih i jednu branching instrukciju. Ova komanda, VLIW kontroliše čitav SIMD blok ALU jedinica, koje rade na istom ili srodnom thread-u u datom trenutku. SIMD jedinice izvršavaju svaki thread paralelno i to na više elementarnih nivoa (5 matematičkih operacija uz obavezan flow control). Zato se kaže da je dizajn Cypress i Barts GPU-ova “VLIW5” tipa. Unutar svakog shader programa postoji specijalna instrukcija koja kontroliše, odnosno opisuje kako bi kod trebalo da se izvrši pod određenim (važećim) uslovima. Niz ovih instrukcija kroz nekoliko povezanih ili jedan (veći) shader program se zajedno nazivaju – flow control. Zahvaljujući preciznom Dispatch Processoru i već pomenutim arbitrima, sve operacije unutar jednog thread-a se izvršavaju paralelno kroz celu SIMD jedinicu, uz napomenu da se Texture i Vertex Fetch operacije prosleđuju i izvršavaju odvojeno.
       

      VLIW5 arhitektura je podrazumevala i da se unutar shader bloka nalaze četiri ALU (shader) jedinice koje obrađuju standardne funkcije, dok je peti ALU (nazivan još i “special, T-unit”) bio u stanju da obrađuje specijalne, trigonometrijske funkcije (sin, cos, log, exp). Izvršne jedinice su povezane sa drugim takvim jedinicama unutar susednih SIMD-ova (uz osam obaveznih ciklusa kašnjenja, koji su „prepleteni“ pa je efektivna latencija svega četiri ciklusa).

      Deljenje instrukcija unutar VLIW5 ALU arhitekture nikad nije jednostavan posao i gotovo je nemoguće postići apsolutnu efikasnost – specijalne funkcije, u odnosu na one standardne ne dolaze uvek u odnosu 4 : 1, pa se tako jako često dešava da kompajler ne može da podeli posao na najbolji mogući način, te neke od ALU jedinica stoje nezaposlene. Cayman ima VLIW4 SPU blok sa četiri ALU jedinice od kojih svaka može da izvršava specijalne, transcendentne matematičke funkcije. Osim što su univerzalnije, SPU jedinice su i jednostavnije, pa je lakše podeliti posao na četiri ALU-a, nego na pet. AMD čak navodi da je na ovaj način povećana efikasnost u toj meri da su performanse po kvadratnom milimetru GPU-a veće i do 10%.

      Od poboljšanja kod nove arhitekture neće samo imati koristi igrači, jer je Cayman efikasniji i kao general purpose computing procesor. Odnos efikasnosti prilikom izvršavanja double-precision floating-point kalkulacija više nema odnos od jedne petine izvršavanja single-precision instrukcije, već je u povoljnijem odnosu od jedan prema četiri. Sada ćemo pogledati kako se izvršavaju različiti tipovi kalkulacija unutar VLIW5, a kako unutar VLIW4 organizovanih SPU-ova:

      VLIW5 u jednom klok ciklusu izvršava:

      Četiri 32-bit FP MAD (Floating Point, Multiply/Add) instrukcije

      Ili dve 64-bit FP MUL (Multiply) ili ADD instrukcije

      Ili jednu 64-bit FP MAD instrukciju

      Ili četiri 24-bit Int (Integer) MUL ili ADD instrukcije

      U svakoj od prethodne četiri, paralelno se izvršava jedna transcendentalna (sin, cos, exp…) funkcija ili još jednu 32-bit FP MAD instrukcija (kao pod 1.)

      VLIW4 u jednom klok ciklusu izvršava:

      Četiri 32-bit FP MAD/MUL/ADD (Multiply/Add, Multiply/Add) instrukcije

      Ili dve 2 64-bit FP ADD instrukcije

      Ili jednu 64-bit FP MAD/FMA/MUL instrukcije

      Ili četiri 24-bit INT (Integer) MAD/MUL/ADD instrukcije

      Ili četiri 32-bit INT ADD/Bitwise instrukcije

      Ili jednu 32-bit MAD/MUL instrukciju

      Ili jednu 64-bit ADD instrukciju

      Ili jednu transcendentalnu, plus još jednu 32-bit FP MAD instrukciju (za transcendentalnu su potrebna tri od četiri ALU-a u SPU-u)

      VLIW5 dizajn shader jedinica datira još iz vremena prvog GPU-a koji je imao programabilne pixel i vertex shader jedinice. Za procesiranje vertex shader programa, VLIW5 je bio odličan izbor – četiri ALU jedinice će procesirati poziciju i boju piksela (x, y, z, c), dok će posebna jedinica obraditi pripremu za osvetljenje. Kada su se pojavili prvi unified shader GPU-ovi (R600), VLIW5 je još uvek bio dobar izbor za jednostavnije i kraće DX9 shader programe. U to vreme je stream computing i GPGPU još uvek bio mrtvo slovo na papiru.

      Međutim, kada je dizajniran Cypress, a onda i njegovi naslednici, situacija sa igrama i general purpose computing-om se dosta promenila. Kompleksniji shader programi unutar igara (DX10 i DX11 generacija) više se nisu izvršavale sa istom efikasnošću kao tokom DX8 i DX9 generacija. Obrada podataka koje daje kompajler tokom rada sa dispatch jedinicom daje informaciju da se T-unit unutar svakog SPU-a koristi u manje od 8% situacija (ako se posmatra totalni prosek, naravno), tj. da 92% vremena stoji neiskorišten. Za GPGPU computing se odavno znalo da bi radio efikasnije uz VLIW4, ali je statistika iz kompajlera pokazala da je to slučaj i sa igrama. Tada je tim Erika Demersa već znao da je vreme da se pređe na VLIW4. Iako se, za to, inicijalno čekao 32nm proces, odlučeno je, kao što smo već pisali, da i 40nm Cayman “pređe” na ovaj dizajn.

      VLIW4 deeper dive

      Kao što vidite u spisku funkcija iznad, VLIW4 SPU može da izvrši četiri matematičke Integer ili FP operacije, dok VLIW5 može da ih izvrši pet. U slučaju da mora da se izvrši transcendentna operacija, VLIW4 SPU mora da iskoristi tri ALU-a da bi izvršio jednu ovakvu funkciju, što ostavlja taj konkretni SPU u istom ciklusu slobodnim da izvrši samo jednu Integer ili FP operaciju. U takvom slučaju, VLIW5 može da izvrši čak četiri Int/FP operacije + transcendentalnu funkciju, što mu daje veliku prednost. Pa ipak, takve situacije se u vreme GP-GPU computinga i DX10 i DX11 igara ne dešava toliko često, pa je češća pojava da T-unit stoji neuposlen. Kada se isti izbaci, dodatni broj tranzistora se može iskoristiti za postavljanje više VLIW4 SIMD jedinica. Tako Cayman ima 24 VLIW4 SIMD jedinice, dok Cypress ima 20 VLIW5 jedinica. U teoriji, zato, po sirovoj computing propusnoj moći, Cypress ne ostaje toliko za Caymanom, ali je u realnom radu sa aktuelnim softverom, ipak efikasniji, jer su mu SIMD jedinice uposlenije. AMD navodi da je novi GPU i do 10% efikasniji po kvadratnom milimetru u odnosu na Cypress, što nije zanemarljiv podatak. Kao što smo gore i pomenuli – svaka od SP jedinica je uposlenija, a kompajler sada više ne mora da “pravi razliku” između običnih i specijalne, T-jedinice.
       

      Erik Demers nam je ispričao da AMD još uvek (pre dva meseca) nije bio siguran u to da li će i sledeća generacija GPU-ova srednje i performance klase (naslednik Junipera, pa i Barts-a) biti VLIW4 tipa. Sasvim je moguće da će VLIW5 biti prisutan i kod Radeon HD6700 i HD7800 serije kartica, a da će VLIW4 u “još jednom krugu” biti rezervisan za najvišu klasu (naslednik Caymana tj. HD7900 serija). Osim toga, tim Terija Makedona već ima pune ruke posla sa izbacivanjem novih profila (na nedeljnoj bazi) za nove naslove, ali pravi “koderi” trenutno ponajviše rade na optimizaciji shader compilera koji radi sa Dispatch jedinicom i to na tome da one budu efikasnije u radu sa VLIW4 SIMD-ovima.

       

      Shaderi, TMU, ROP…

      Kao što smo već pomenuli, prethodnik Caymana je imao jedan graphics engine koji čini rasterizer, hierarchical-z, teselator jedinica i asembler jedinica za geometry i vertex shading. Cypress je imao poboljšan graphics engine – dual rasterizer i dual hierarchical-Z koji su omogućili obradu 32 piksela po kloku (ranije je bilo moguće “provući” 16). To je bio prvi korak ka “dupliranju” čitave graphics engine jedinice. Cayman, tako, ima dva graphics engine-a, kao što se i vidi na dijagramu na prethodnoj strani. To takođe znači da novi GPU ima mogućnost da rasterizuje dva trougla po klok ciklusu, što znači da mora da ima dva odvojena logička bloka koja izvršavaju triangle setup, odnosno pripremu scene na nivou primitive. Osim toga, Caymanov dual-graphics engine ima mogućnost za rad na dva odvojena seta pripreme scene uključujući i backface culling (izbacivanje poligona koji neće biti vidljivi u krajnoj sceni (sećate se PowerVR Kyro kartica koje su, svojevremeno, u tome bile najbolje?), deljenje poligona (subdivision) i pripremu za tessellation. U ovom polju, ipak, AMD zaostaje za NVIDIA solucijom. GF110, primera radi, ima četiri “rasterizatora” koji obuhvata ukupno 16PolyMorph engine-a.

      U odnosu na Cypress, Cayman ima povećan broj SIMD “endžina” – za četiri, pa ih sada ima 24. Kako SIMD engine ima 16 SPU-ova, a svaki SPU (kod Cypress-a), pet ALU, shader jedinica, kalkulacijom: 20 x 16 x 5 dolazimo do brojke od čuvenih 1600 streaming processors jedinica. Cayman ima četiri ALU-a po SPU jedinici, pa računica izgleda nešto drugačije: 24 x 16 x 4 = 1536. Svaki SIMD engine ima po četiri TMU jedinice, 512KB L2 teksturne keš memorije i 64KB deljene bafer memorije. Dakle, na svaka 4 SPU-a i na svakih 16 ALU (shader) jedinica, ide jedan TMU, a ukupan broj teksturnih jedinica je 96, što je za 50% više u odnosu na Cypress (koji ih je imao 64). Ovo je, uz dual graphics enginejedan od najvećih “unapređenja” u odnosu na Radeon HD5800 seriju koji bi mogao da bitnije utiče na performanse u igrama.
       

      Render back-end jedinica je ostala, praktično ista, kada je kvantitet u pitanju. I dalje može da obradi 32 piksela po kloku i 128 z-stencil informacija. Drugim rečima, ukupan broj ROP jedinica je i dalje 32. ROP je, ipak, dosta poboljšan za rad sa određenim tipom izlaznih podataka. INT16 operacije se izvršavaju dva puta brže, FP32 operacije se, tako, izvršavaju od dva do čak četiri puta brže.

      Tessellator – 8. generacija

      Shader Model u verziji 5.0 obuhvata High Level Shader Language (HLSL) koji pruža još dodatnih i novih načina za implementaciju shader programa. U odnosu na prethodnu verziju donosi podršku za double-precission, odnosno podršku za još duže i kompleksnije shadere. Hardverski tessellator je bio prisutan i u RV870 GPU-u, koji ATI razvija još od 2001. godine, a koji je u praksi najviše korišten unutar Xenos GPU-a kod Xbox 360 konzole, sada je podržan i od strane DirectX 11 API-ja. Dalje usložnjavanje objekata putem sub-division algoritama je moguće izvesti na više načina, ali su u DirectX 11 API-ju podržani Hull Shader i Domain Shader algoritmi. Jasno je da Tessellator samo može da učini da uglastiji objekat postane obliji, što će biti od pomoći na nekim objektima i terenima, ali ne može da kreira neke suptilne detalje na objektu, koje sam dizajner nije predvideo na njemu. Zato je za postizanje finih detalja na objektima i dalje neophodno koristiti displacement mape, kakve su bump teksture ili occlusion mape, koje se mogu koristiti i u sprezi sa transparentnim detailed mapama koje dodaju detalje na objektima sa baznom kolor teksturom bez potrebe da ista bude u ultra-visokoj rezoluciji.

      Tessellator jedinica unutar Cayman GPU-a pripada osmoj generaciji. Novi tessellator omogućava off-chip bafering, što znači da se podaci o geometriji koju je kreirala sama jedinica mogu da se čuvaju u DRAM memoriji ako su on-chip keš memorije prepunjene.

      Zbog čega je GF100 i GF110 efikasniji u tesselation operacijama od Cypress-a i Barts GPU-a? Najpre možemo da krenemo od rečenice iz prethodnog dela teksta u kome smo pomenuli da je tek sa Caymanom AMD napravio dual graphics engine koji pravi osnovne pripreme geometrije za dalju teselaciju. GF100 i GF110 imaju četiri ovakva “endžina” koji obuhvataju čak 16 PolyMorph jedinice. AMD je svestan činjenice da je tek sa Caymanom napravio GPU koji može da rasterizuje dva trougla po klok ciklusu, dok NVIDIA odavno može da rasterizuje četiri trougla po klok ciklusu. GPU kakav je Barts može da radi na jednom trouglu unutar jednog klok ciklusa, a da bi GPU mogao da obradi ogroman broj poligona, mora da bude i u stanju da paralelno izvršava rasterizaciju na više trouglova po klok ciklusu, najpre zato što će, kako sada stvari stoje, shader jedinica lako moći da “oboji i osenči” sve te poligone, jer je u odnosu na geometrijski deo čipa, u tom smislu prilično moćna.

      U prethodnoj, sedmoj generaciji tessellator jedinice, AMD je uspeo da učini GPU znatno efikasnijim kada ista radi sa nižim faktorima za deljenje (situacije u kojima su performanse tessellator jedinice šeste generacije bile problem). Međutim, kod sedme generacije, AMD je upravo pričao o tome kako previše visok tessellation faktor dovodi do “overshadinga” tj. da svaki piksel u tim situacijama traži preterano veliki i redudantan broj shading prolaza. U AMD-u smatraju da brute force pristup ne vodi ničemu i da je bolje imati optimalne performanse pri dobro izbalansiranom načinu dizajniranja 3D scene. Dakle, problem sa šestom (Cypress), a donekle i sedmom generacijom tessellator jedinice (Barts) jesu performanse. Ipak, Barts je oko dva puta brži od Cypress-a kada se koriste faktori deljenja između 6 i 10 piksela po poligonu i oko 50% brži na nižim faktorima i onim koji su viši od 13-14 piksela po mesh-u (poligonu). Efikasnosttessellation jedinice i više radne učestanosti su još dva razloga zbog kog Barts, u modernim igrama, u kojima se intenzivno koristi tessellation na Radeon HD6870 kartici može da susitgne, a nekad i prestigne Cypress na Radeon HD5870 modelu. No, da bi osma generacija tessellation jedinice imala smisla, GPU mora biti sposoban da “provuče” više od jednog trougla po klok ciklusu, a Cayman to upravo i može. Kod Cypress-a, prilikom tessellation operacija, samatessellation jedinica je bila usko grlo. A, da je osma generacija ove jedinice bila implementirana na Barts, graphics enginebi bio usko grlo. To je još jedan od razloga zbog kog Cayman ima dva graphics engine-a.
       

      Kako je i tesselation jedinica poboljšana u odnosu na Cypress, a i sam GPU ima mogućnost za obradu dva trougla po klok ciklusu, Cayman može da, u određenom trenutku, barata sa tri puta većom količinom podataka o geometriji (u odnosu na Cypress). Ipak, zbog uštede prostora (i količine tranzistora), kod Caymana nisu povećane cache memorije u odnosu na prethodnika, pa je, kao što smo ranije naveli, omogućeno da se, po potrebi, geometry podaci snime u DRAM memoriju (koje, eto, ima sasvim dovoljno). Off-chip buffer je nužno zlo, jer je čak i najbrža GDDR5 memorija dosta sporija i ima mnogo veće latencije u odnosu na lokalne, on-chip, bafer memorije. Ipak, jasno je da je bolje da GPU ima off-chif buffer mogućnosti nego da performanse drastično opadnu u situacijama kada u 3D sceni ima mnogo baratanja sa sirovom geometrijom. Zbog svega navedenog, AMD tvrdi da su tesselation performanse Caymana negde od 1.5 do čak 3 puta veće u odnosu na Cypress.

      Bolji antialiasing

      MLAA

      Osim poboljšanog anisotropic filtering algoritma, kod Barts i Cayman GPU-a, AMD je uveo i nov tip antialiasing-a. U ovoj oblasti, NVIDIA je tradicionalno bila bolja, bar kada su u pitanju „pametni“ oblici antialiasing-a, a ne „brute force“ varijante kakav je SuperSampling. NVIDIA CSAA (Coverage Sample Anti-Aliasing) u kombinaciji sa alpha-to-coverage jako lepo radi u igrama koje se dešavaju u prirodi (drveće, trava i lišće se obično predstavljaju alpha-teksturama). Klasični antialiasing algoritmi se izvršavaju tokom pripreme scene, bilo da se radi o MSAA ili SSAA metodama ili novijim Transparency, Temporal MSAA varijantama ili čak Custom Sample AA algoritmima. Svi ovi metodi moraju da imaju neku vrstu detekcije ivice ili alfa kanala unutar teksture, ali se sam AA primenjuje pred sam kraj pripreme scene.

       

      Međutim, novi AMD-ov antialiasing algoritam je post-processing tipa. Naziva se Morphological Anti-aliasing (MLAA), radi u svim naslovima, bez obzira na API i primenjuje se na krajnju, 2D sliku. MLAA algoritam traži specifične vrste ivica na slikama, između kojih postoji velika razlika u kontrastu, a koji su udaljeni svega par piksela jedan od drugog. S obzirom na to da se primenjuje na običnoj 2D slici, MLAA je prilično nezahtevan metod, a ATI ga je već koristi na nekoliko generacija starom Xenos GPU-u unutar Xbox 360 konzole. Ovaj post-processing algoritam se obavlja u SP jedinicama, pa je moguće da će ga AMD „uključiti“ i kod Radeon HD5800 serije kartica.
       

      Njegova prednost je što je nezahtevan i što će umekšati sve ivice. S druge strane, pošto radi sa 2D slikom, nije baš preterano „bistar“, pa će možda umekšati (zamutiti) i sliku tamo gde to nije potrebno, što dovodi do gubitka detalja. Ipak, sa njim možete eksperimentisati – pokazalo se da su SSAA i MSAA metodi često dosta zahtevni za igre kao što je Crysis (na Ultra podešavanjima), pa proverite da li će MLAA dati bolje rezultate u odnosu na situaciju kada nikakav AA nije primenjen. SuperSample Anti-Aliasing metod i dalje daje najbolji kvalitet prikaza – najstariji je i najkompatibilniji sa igrama, pogotovo ako se uključi i alpha-to-coverage, dok je MSAA negde između, a pruža jako dobre rezultate ako se aktivira adaptivni AA i transparency metod.

      EQAA

      Novi algoritam za umekšavanje ivica, popularni antialiasing – naziva se Enchanced Quality Antialiasing ili EQAA. Po svojoj funkcionalnosti je veoma sličan već pomenutom CSAA (coverage sampled antialiasing) metodu koji je NVIDIA predstavila uz G80 GPU. U to vreme, AMD je ponudio custom-filtered antialiasing (CFAA), o kome smo detaljno pisali tokom prvih DirectX 10 generacija Radeon i GeForce akceleratora (podsetićemo da su CFAA imali narrow i wide tentmodove). Osim standardnih, MultiSampling i brute force SuperSampling metoda, AMD je imao i edge-detect metod CFAA antialiasing-a, a u poslednjoj generaciji je dodat i post-processing algoritam, koji radi umekšavanje na finalnoj, 2D slici (Morphological Antialiasing, MLAA). Od CFAA metoda se gotovo odustalo, baš kao i ranije od Temporal Antialiasing-a (TSAA). Svi ovi metodi antialiasinga (osim MLAA, koji i nije AA u pravom smislu reči) funkcionišu na bazi čuvanja kolornih informacija piksela koji se nalaze na ivici i to u render back-end delu GPU-a.

      I anisotropic…

      AMD je dodatno poradio na kvalitetu anizotropnog filtriranja, što nije bilo toliko komplikovano kao što izgleda, s obzirom na to da smo već pomenuli kako je ova specijalizovana jedinica sada izbačena iz GPU-a i dodeljena, kao programabilna funkcija, u sam compute-shader deo GPU-a (streaming jedinice). AMD tvrdi da je novi algoritam jednako dobar kao referentni, emulirani Direct3D rasterizer, ali, naravno, neuporedivo efikasniji, jer nije ništa sporiji u odnosu na rešenje iz prethodne generacije. U ovom trenutku, dakle, AMD poseduje rešenje koje je bolje od konkurentskog, čak i kada se u ForceWare drajverima primeni high quality filtering. Čak i za običan trilinear filtering mod, AMD sada primenjuje full -true trilinear bez primene blending­a koji je uvek bio uključen, kako bi se aproksimacija prethodnih, manje preciznih (tzv. adaptive trilinear) metoda, koje su se koristile radi boljih performansi, manje videla u igrama. Kako se sada ova operacija obavlja unutar shader jedinica, AMD je odlučio da poveća kvalitet prikaza i na tome im skidamo kapu. Zadržavanje adaptive trilinear metoda bi možda dodatno povećalo performanse (i dalje ga je moguće aktivirati u drajverima), ali je podrazumevano (default) podešavanje – full trilinear. Sve ove funkcije su postojale i kod Evergreen generacije GPU-ova, ali AMD je napravio dodatna poboljšanja kada je u pitanju anizotropno filtriranje tekstura.

      Kod Cypress GPU-a smo prvi put videli anizotropno filtriranje koje je potpuno nezavisno od ugla pod kojim se prikazuje neka površina (tekstura) – nešto sa čim je Radeon HD4000 i serije pre nje, imala poteškoća. Međutim, i novi AF algoritam, koliko god delovao savršeno, imao je poteškoća sa velikim ravnim površinama i teksturama koje imaju čest, sitan patern ponavljanja (metalne površine sa pravilnim urezima i sl.). U tom slučaju se jasno vidi razlika između dve mip-mape tj. iste teksture različitih mip nivoa (čuveni krugovi oko “igrača”). Taj problem nije do kraja rešen i vidljiv je na specifičnim teksturama koje se obično javljaju u trkačkim igrama ili u naučno-fantastičnim FPS naslovima. Kao što smo imali prilike da vidimo i u Los Anđelesu i ovaj problem je rešen od Barts GPU-a, a prirodno, važi i za Cayman GPU.

      Osim algoritama koji su i ranije bili prisutni, sada je tu i block texture compression mod koji je AMD osmislio i predložio da bude uključen u DirectX 11 specifikaciju. Ovaj algoritam podrazumeva efikasniju kompresiju, brži rad i viši kvalitet nakon rekompresije u odnosu na prethodna rešenja (bolji rad sa alfa-kanalima, transparentnim i FP16 HDR slikama, bolji signal-to-noise odnos, itd.), pa je sada moguća kompresija i u odnosu od 6 : 1 i to za teksture koje su prilično velike (čak 16.000 x 16.000 piksela).

       

      PowerTune

      PowerTune je tehnologija koju poznajemo od ranije  – zaslužna za izuzetno nisku potrošnju Evergreen familije kartica uidle režimu rada. Nova verzija ove tehnologije dodatno optimizuje potrošnju, ali ne samo u idle režimu, već bi to trebalo da čini i kada je kartica pod opterećenjem. Naime, radi se o mehanizmu koji sprečava da kartica, tj. GPU “povuku” više struje nego što im je zacrtano tokom maksimalnog TDP (total dissipation power) opterećenja u “normalnim” situacijama. Ovo će sprečiti da aplikacije poput FurMark-a, koji umeju GPU da opterete i preko 100% (znamo da je to, matematički nemoguće, ali nemamo bolji način da opišemo ono što FurMark radi grafičkom čipu i čitavom akceleratoru, zbog čega ga nikad nismo ni koristili tokom testiranja). NVIDIA je ovakav mehanizam uvela kod GeForce GTX 580 i GTX 570 akceleratora, ali je AMD korisnicima omogućio da taj feature i detaljnije kontrolišu putem (novih) drajvera. Kao što ćemo videti prilikom opisa samih kartica, Cayman akceleratori poseduju novi mikroprocesor koji nadgleda trenutnu potrošnju GPU-a i memorije i stara se da ukupna potrošnja ne preskoči propisanu vrednost za taj model. Ali, dok je ovo možda dobra stvar za sam AMD i njihov PR koji će prezentovati Green Peace-u, igračima i testerima može samo da zada glavobolju. Jer, PowerTune će, pri većem opterećenju oboriti radne frekvencije čipa, ako TDP premaši određenu, propisanu granicu. Ali, ova granica neće biti premašena samo u FurMark testu – PowerTune će oboriti “klokove” i u izuzetno zahtevnim igrama, kada je uključen AA i AF.
       

      AMD je ovu opciju uveo iz istog razloga kao i NVIDIA, ali ju je daleko bolje dokumentovao i dao korisnicima slobodu da je pojačaju ili ublaže. Pod “Overdrive” tabom u Catalyst drajverima je moguće “dati” grafičkom čipu do 20% ekstra “prostora”, te će moći da povuče i za petinu više struje nego što je to propisano. Ako, pak, želite da uštedite na računu za struju, možete i smanjiti TDP za do 20%, pa će PowerTune mnogo češće i žešće da obara radne frekvencije vašeg akceleratora. U igrama koje nisu zahtevne, korisnici ovo mogu da učine kako bi kartica radila hladnije i tiše (ako je već razlika u potrošnji, čak i na godišnjem nivou – zanemarljiva).
       


       

      Razlog koji smo pomenuli na početku prethodnog pasusa je sledeći. Postoje određeni testovi, koji, slično PRIME95 testu za opterećenje sistemskog procesora, “prže” GPU i čine da isti vuče mnogo više struje nego što bi to činio i tokom najzahtevnije igre. Ovakve aplikacije (FurMark ili 3DMark Perlin Noise test) će činiti da GPU vuče previše, a ako ne bi postojao sistem koji štiti sam akcelerator i GPU, moglo bi da dođe i do oštećenja hardvera. Takođe, slične aplikacije su činile da se proizvođači grafičkih kartica u prošlosti drže konzervativnijih fabričkih vrednosti za svoje kartice, što sada neće biti slučaj. GPU i memorija će u budućnosti biti setovani agresivnije, a ako je poenta da se kartica sintetički “prži”, sistem će je zaštiti od ovakvog načina “zloupotrebe”.
       


       

      Tokom overklokovanja i testiranja, mi smo, naravno, postavili PowerTune na +20%. Korisno je znati da korisnik na ovakav način može dodatno da se zaštiti. Ako overklokuje karticu za 10%, može i PowerTune da “pojača” za istu vrednost, kako bi bio siguran da GPU ne radi pod preteranim opterećenjem i da, ako išta krene loše da se dešava, postoji sistem koji će sprečiti da bilo šta pođe kako ne treba. Takođe, u nižim klasama kartica i u zatvorenom kućištu manjih gabarita (recimo u nekom Home Theater PC računaru) korisnik može da “utiša” karticu i tako što će smanjiti PowerTune i postaviti ga na -20%. Kartica će i dalje biti dovoljno brza za akceleraciju video materijala, ali će 20% niži TDP učiniti da ventilator retko kad radi brže od najsporijeg “režima”, što će rezultovati i tišim radom. Pošto je maksimalni TDP za Radeon HD6970 – 250W, uz +20% dodat kroz Catalyst PowerTune, stižemo do maksimalnih 300W koliko bi kartica smela da “povuče”, što je, po našem mišljenju, sasvim dovoljno. Naravno, ovde će biti oštećeni hardcore overklokeri, koji kartice hlade tečnim azotom i kojima će, verovatno, biti potrebno i više od 350W za ovakvu karticu, u pojedinim slučajevima. Ovi korisnici će, verujemo, moći da se snađu i zaobiću PowerTune pomoću nekih specijalnih alata, tweak-ova ili modifikacije drajvera.
       

      AMD EyeSpeed i EyeFinity

      Jedna od zanimljivih novina je i novi Catalyst A.I. slajder koji omogućava da se dodatno podesi nivo optimzacije u radu sa teksturama. Sada se pod Texture Filtering Quality opcijom pod Catalyst A.I. nalaze tri opcije  – High Quality, Quality (podrazumevana) i Performance. High Quality praktično isključuje Catalyst A.I., dok Quality uključuje dve opcije koje su se ranije nalazile pod posebnim „tabom“, do kog se teško dolazilo (enable trilinear optimization i anisotropic sample optimization). Takođe, Teri Makedon je pomenuo da je sada svaki sRGB prikaz uz pomoć Radeon HD6000 serije kartica propisno kolorno kalibrisan, što će dosta značiti vlasnicima Wide Color Gamut LCD / TFT ekrana.

      Kontroler koji omogućava prikaz slike na ekranu je potpuno redizajniran da se može reći da je ponovo kreiran – od nule. Naime, on sada podržava sve tipove video konekcija, od D-Sub-a, preko DVI-I i HDMI konekcije, pa sve do Display Porta u verziji 1.2. Osim toga, novi display controller nudi mogućnost prikaza do čak šest video stream-ova uz preciznost od 10-bita po komponenti (boji). Ovaj programabilni deo GPU-a je tako i u mogućnosti da prikaže jedan “ekran” u fantastičnoj rezoluciji od 5760 x 2160 piksela. Štaviše, u ovoj rezoluciji se možete i igrati!


       

      Na prvih nekoliko strana smo pominjali i mogućnost da Radeon HD5870 akcelerator prikaže sliku na čak šest monitora. Svakako, za tako nešto vam je potrebno specijalno izdanje koje se naziva Radeon HD5870 Eyefinity6 Edition. Danas je to moguće učiniti sa samo jednom karticom, uz pomoć dodatnih adaptera, ali čak i bez njih možete da sastavite tri ekrana i radite u fantastičnih 5760 x 1080 piksela. Sa dve kartice, ako se upotrebi svih šest displeja, maksimalna rezolucija za svaki od njih se spušta na 1920 x 1080 piksela, što ukupno daje mod od 5760 x 2160 piksela! I da, u ovoj rezoluciji možete igrati Crysis, Flight Simulator, Dirt 2, Need For Speed ili skoro bilo koju aktuelnu igru koja vam padne na pamet. Naravno, za solidne performanse u tako monstruoznim grafičkim modovima će biti neophodno i da dodatno osnažite grafički podsistem sa još jednom, dve ili tri Radeon HD6870 kartice, ali ako baš imate viška para, prostora i sebe smatrate ultimativnim igračem, dobro je znati da je i ovako nešto moguće. Štaviše, u CrossFire X varijantama je moguće povezati čak i 24 monitora, što će se retko viđati i na sajmovima, ali je sjajna demonstracija sile! Uostalom, za igranje u 5760 x 2160 piksela, mogli biste da pazarite dve Radeon HD6970 kartice. Ili dva DualGPU Radeon HD6990 modela!
       
      Kod Northern Islands serije GPU-ova, AMD je modernizovao i tipove video-out konekcija. Radeon HD6800 kartice podržavaju i stižu sa HDMI 1.4a portom, koji podržava Blu-ray 3D. Tu je i podrška za novi DisplayPort u verziji 1.2, koji takođe podržava 3D. DisplayPort 1.2 zapravo ima dovoljno veliki bandwidth da prikaže sliku na čak četiri FullHD ekrana u 1080p rezoluciji (za to je, ipak, neopdodan Multi-Stream-Transport hab (MST hab)) ili čak dva ekrana u rezoluciji 2560 x 1440 piksela, što je korisno znati ako imate dva 30-inčna monitora. Dva DVI konektora na kartici nisu ista, pa jedan daje maksimalnu rezoluciju od 2560 x 1600 piksela (Dual-Link DVI), a drugi 1920 x 1440 piksela (Single-Link DVI).
       

      DisplayPort 1.2 ima značajan broj prednosti u odnosu na DL-DVI, pa čak i HDMI 1.4, a to su:
       

      znatno viši propusni opseg (DisplayPort 1.2 ima dva puta veći bandwidth od verzije 1.1 i podržava istovremeni protok različitih display tajminga i rezolucija, ali i osvežavanja i dubine boja)

      DisplayPort 1.2 je neophodan za prikaz Ultra-HD rezolucija (Radeon HD6800 kartice mogu da prikažu sliku na jednom ekranu, putem jednog DP priključka čak i u rezoluciji 4096 x 2160 piksela pri osvežavanju od 50 Hz)

      za razliku od HDMI i DVI standarda, DisplayPort omogućava povezivanje uređaja putem jako dugačkih, pasivnih kablova

      podržava prenos audio signala, za razliku od DVI konektora

      podržava prenos različitih tipova signala i originalnog TMDS signala sa karakteristikama koje su pogodne za DVI ili HDMI, pa je zato jako lako i jeftino napraviti DP-DVI ili DP-HDMI adaptere

      HDMI je pogodan za prenos 3D stereoskopskih slika u rezoluciji od 1920 x 1080 piksela pri 30 fps, ali je za veći frejmrejt potrebno ići na DisplayPort 1.2

      DisplayPort 1.2 ima propusnu moć od 17 Gbit/s, što je dovoljno za prikaz slike na četiri 1080P ekrana pri osvežavanju od 60 Hz ili dva 2560 x 1600 displeja pri istom 60 Hz osvežavanju, odnosno 3D sliku na 2560 x 1600 piksela uz osvežavanje od 120 Hz.

      Unified Video Decoder (Engine) 3.0

      Prva generacija AMD Unified Video Decoding engine-a je već bila dovoljno usavršena i o njoj smo više puta pisali. NVIDIA grafičkih procesori od G84 na ovamo, kao i nova familija Radeon HD2000 (bez 2900XT i Pro modela) i HD3000 akceleratora imaju posvećeni video processing engine koji ATI naziva Unified Video Decoder. U odnosu na AVIVO, UVD je napredovao koliko i PureVideo HD druge generacije u odnosu na rešenje iz GeForce 7 familije, a nakon njegovog izostanka ili nefunkcionalnosti kod R600 kartica, našao je svoje mesto kod aktuelne HD3800 serije. AMD tvrdi da je smanjenje CPU utilizacije pri posmatranju H.264, a posebno VC-1 video formata, koji su postali standardni video kodeci za BluRay naslove zaista vredno pažnje, čak i na desktop sistemima. Prilikom obrade HD video signala, pred grafičkom karticom stoji izazov koji se ne završava samo na procesiranju bar 6x više informacija u odnosu na video signal standardne definicije. Jednostavno rečeno, grafičke kartice poseduju specijalnu logiku koja im objašnjava kako da brojneshader jedinice iskoriste za obradu video signala. Pošto su GPU-ovi sve moćniji, zbog čega stati na 1080p rezoluciji? AMD je proširio podršku i za XHD rezolucije, što nam nije teško da zamislimo jer, ako ove kartice bez problema rade sa stotinama tekstura visoke rezolucije koje “lepe” na hiljade poligona u 3D igrama, zbog čega ne bi mogle da, tridesetak puta u sekundi, nalepe jednu “teksturu” na jednu površinu na ekranu. Naravno, jasno je da se na tu “teksturu” primenjuju malo zahtevniji algoritmi od običnog trilinear ili anisotropic filtera, brinuti o daljem toku podataka, korekciji i kompenzaciji pokreta, de-interlacing-u, 3:2 ili 5:5 pulldown-u (RealCinema 24p) i tome slično, ali je sve to, složićete se, i dalje manje kompleksan “shader program” od “sličnih” rutina u modernim igrama.
       


       

      Početne BitStream i Entropy Decode faze se sada izvršavaju od strane GPU-a. UVD je kreiran da u potpunosti dekodira i najzahtevnije (i najnaprednije) video kodeke kakvi su VC-1 i H.264, uključujući i bitrate od 40 Mbps ili više i koristi već postojeća, programabilna SIMD jezgra, odnosno Stream Processors jedinice. Ono što Radeon GPU-ovi podržavaju još od prve generacije UVD „endžina“ , a od nedavno i konkurencija sa novim GPU-ovima, naziva se full-speed CABAC i CAVLC dekodiranje u okviru H.264 i VC-1 kodeka. Sav postprocessing se obavlja unutar shader jedinica, uz primenu filtera koji su ništa drugo do namenski kreirani shader programi koji se u potpunosti izvršavaju in hardware. HDMI, odnosno High Definition Multimedia Interface je u potpunosti podržan od strane RV670 i novijih AMD GPU-a, zajedno sa obaveznim HDCP (High-bandwidth Digital Copy Protection) sistemom zaštite od kopiranja. Osim digitalnog signala, HDMI konektor “prenosi” i više kanalni audio zvuk, koji RV770, kao i RV790 i RV870 podržavaju. Novina kod Cypress GPU-a bila je hardverski upscale 1080p filmova u rezoluciju 2650 x 1600 piksela, što zaista izgleda impresivno. Novine UVD 2.0 endžina su bile:
       

      Hardware acceleration dekoding za dva 1080P HD stream-a

      Kompatibilnost sa Windows Aero modom  – reprodukcija HD video klipova uz aktivan Aero Glass mod na desktopu

      Video gamma – gamma kontrola je nezavisna od iste koja važi za Windows desktop

      Brighter whites – Blue Stretch procesiranje povećava vrednost svetlijih tonova za dinamičniji prikaz videa

      Dynamic Video Range – bolja dinamička kontrola tamnih tonova i crne tokom reprodukcije

      Dodate su i funkcije Dynamic Contrast Enchancement i Dynamic Color Enchancement za koje već iz samog naziva možete da predpostavite koju ulogu imaju. Kod prethodne generacije UVD-a smo imali podršku za maksimalno 5.1, 16-bit PCM Stereo ili kompresovani AC3 5.1 više kanalni audio-stream po Dolby Digital i Dolby DTS standardima, ali je to kod RV770 i novijih čipova sve dovedeno na viši nivo – sada je podržan osmokanalni (7.1) audio uz maksimalan bitrate od 6.144 Mbps i sempling od 192KHz i 24-bita. Podrška za “filmske” formate se ne zaustavlja na Dolby DTS i Digital standardima – tu su sada i True-HD i DTS HD formati u koje se slažu zvučne slike na novim BluRay izdanjima. Još jedna od bitnih novina je i mogućnost dual-stream plejebeka, pa Cypress može da pusti dva HD video feed-a i to u modu “slika-u-slici” sa kompletnim de-kodiranjem kroz VC-1, H.264 i MPEG-2 (uz upscaling DVD formata u HD rezolucije i nove profile sa dinamičkim kontrastom).

      Treća generacija Unified Video Decoder “endžina” donosi vrlo bitne novine. Među najbitnije dve je hardverska akceleracija 3D Blu-ray video kodeka (MVC), kao i MPEG-2 dekoding, koji se sada u potpunosti obavlja unutar GPU-a. MPEG 4 Part 2, poznatiji kao DivX, sada se takođe dekodira hardverski, unutar GPU-a.

      AMD Accelerated Parallel Processing (APP)
       


       


       

      Takođe ćemo pomenuti da je AMD preimenovao ATI Stream u AMD Accelerated Parallel Processing (APP), koji se oslanja na OpenCL kao standard za taskove koji podrazumevaju veliku paralelizaciju u radu (obrada i rendering video materijala npr.). I dok NVIDIA za svoj zatvoreni CUDA sistem ima poseban sajt (CUDA Zone), AMD je kao podršku za otvoreni standard kreirao sajt OpenCL Zone. AMD, naravno, podržava i jedan od standarda koji nije jednako otvorenog koncepta, ali je deo „nezaustavljive“ mašinerije zvane Microsoft DirectX 11 – naravno, radi se o DirectCompute 11 standardu. Naravno, APP nije stvar koja je rezervisana samo za grafičke kartice, jer će se OpenCL i drugi otvoreni API-ji i razvojna okruženja izvršavati i na x86 procesoru kakav je AMD Fusion. Zapravo, GPU deo Fusiona će se oslanjati na OpenCL i DirectCompute 11, a CPU na x86 instrukcije. APP SDK u verziji 2.2 se može preuzeti sa AMD-ovog sajta.

      Open Stereo 3D inicijativa

      Ako imate neki od vertikalno polarizovanih LCDTV uređaja i pasivne, odgovarajuće naočare sa polarizovanim staklima, zašto da ne iskoristite ovaj sistem? U svakom slučaju, između vašeg 3D iskustva sa jedne i aplikacije (igre) i drajvera sa druge strane, stoji posebna vrsta softvera (tzv. middleware), koji od 3D igara kreira prave, stereoskopske – 3D igre. Kompanije kao što su DDD ili iZ3D već imaju gotova rešenja koja su demonstrirana upravo na launchu Radeon HD6800 karticau Los Anđelesu. Mi smo imali prilike da igramo igre Deus Ex 3 i Medal of Honor uz pomoć aktivnih, odnsono pasivno polarizovanih Oakley 3D naočara i bili smo gotovo fascinirani onim što smo videli. Rešenje svakako nije lošije od NVIDIA 3D Vision-a, ako u nekim momentima nije i bolje. I, posle nekog vremena ne dolazi do zamora u očima. Softver, koji je zapravo driver wrapper, iz kompanija DDD i iZ3D već sada ima preko 400 profila za aktuelne 3D igre. I što je zanimljivo, ovaj softver radi i sa NVIDIA grafičkim karticama, pa ako se odlučite za GeForce, a ne sviđa vam se njihov 3D Vision sistem, znajte da postoji izbor.

      Ovim smo došli do kraja predstavljanja tehnologije vezane za Cayman GPU i Radeon HD6900 seriju grafičkih kartica. U tekstu koji sledi, predstavićemo referentne Radeon HD6950 i HD6970 akceleratore, a onda i njihove performanse u čak 22 aktuelne igre i benchmark programe u kojima ih poredimo sa direktnim konkurentima i prethodnicima iz sopstvene kategorije.

      Kartica na testu – AMD Radeon HD6990

      Prva Radeon HD6990 kartica koju smo testirali je stigla u vidu AMD-ovog Non Qualification Sample-a, s kojim nije došla nikakva prateća oprema. Dakle, dobili smo samo karticu i FTP sa drajverima i tehničkim materijalom i to na dan svetskog launch-a (verovatno “ljubaznošću” naše carine koja je uvek ažurna i voljna za svaku vrstu saradnje).  Na prvi pogled se vidi da je kartica jako velika i masivna, ali prijatno iznenađuje to što nije ni duža ni mnogo teža od Radeon HD6970 akceleratora, iako je impresivno to što se radi o akceleratoru koji ume da povuče / disipira čak 450W energije. Koncept i sam PCB dizajn se ne razlikuju previše od proverenog nacrta koji je korišten za Radeon HD5970, ali je opet sve za nijasnu veće i kompleksnije.


      Da bi to ohladio, AMD je koristio oprobani Vapor Chamber  sistem, a pošto ovoga puta imamo dva Cayman GPU-a, kuler je praktično Dual Vapor Chamber, sa centralno postavljenim ventilatorom. Pomalo nas je iznenadilo što se AMD nije odlučio za rešenje sa dva ventilatora, jer ga koriste gotovo svi partneri kod kartica više klase. Zato smo ubeđeni da će rashladni sistemi na Radeon HD6990 karticama iz ASUS-a, MSI-ja, Gigabyte-a, Sapphire-a i drugih kompanija biti dosta efikasnije i da će GPU-ove držati na nižim temperaturama, a ambijent u većoj tišini. Radeon HD6990 po prvi put ima i specijalni premaz termalne paste između kulera sa jedne i GPU-ova i memorijskih čipova sa druge strane.
       

      Radeon HD6990 ima jedan konektor za Crossfire, što znači da je jednu ovu karticu moguće upariti sa samo još jednom, a ne još tri kartice, kao što bi to bilo moguće da postoje dva Crossfire konektora, kao kod Radeon HD6950, HD6970, HD6850 i HD6870 modela. Cayman Crossfire X setup podrazumeva četiri GPU-a, odnosno dve Radeon HD6990 ili četiri Radeon HD6950 / HD6970 kartice. Za ovako veliku karticu je sasvim očekivano da ima dva 8-pinska PCI Express konektora za eksterno napajanje, što je i maksimum koje je jedna grafička kartica ikada imala. Zanimljivo je da su kod Radeona HD6990 ova dva konektora malo razmaknuta jedan od drugog, ali i za to postoji razlog.
       

      Kada smo kod konektora, pomenućemo i da AMD zaista nije štedeo kada su video izlazi u pitanju, pa je Radeon HD6990 spreman za najrazličitije EyeFinity kombinacije. Na kartici se nalazi jedan Dual-Link DVI konektor i četiri Mini DisplayPort priključka. Iako je prošlo dosta vremena dok se nismo “otarasili” D-Sub priključka, izgleda da će DVI konektor dosta brže izaći iz mode, jer su Mini DP  i mini HDMI konektori sve češći. Ali, ako vaš EyeFinity sistem čine monitori koji imaju samo DVI priključak, ne morate brinuti. Uz svaku retail karticu, AMD partneri će isporučivati dva Mini DisplayPort – DVI adaptera, kao i jedan Mini DP – HDMI adapter. Zaista lep gest, zar ne? Lepo je što AMD nema istu poslovnu politiku kao Apple, jer bi vam svaki od ovih adaptera posebno naplatio po 29 dolara. Dakle, umesto dva DVI (od kojih je jedan DL-DVI, a drugi SL-DVI), jednog mini-HDMI i dva mini-DP slota, AMD se odlučio na DVI + 4x mini-DP konfiguraciju.
       


       

      Još jedna od mogućnosti koje su nam poznate sa standardnih Cayman kartica, nasleđene su i kod Antilles-a, pa je tako tu i “switch” kojim možete birati između bios-a 1 i bios-a 2 i tako. I dok je kod Radeon HD6950 i HD6970 modela bios 1 bio “fail-safe”, a bios 2 za isprobavanje i eksperimentisanje, kod Radeona HD6990 je ova funkcija iskorištena na drugačiji način. AMD je osmislio sistem koji naziva AUSUM (čita se isto kao i reč “awesome”, što u slobodnom prevodu znači super, fenomenalno ili u domaćem slengu – “strava”). AUSUM je skraćenica za Antilles Unlocking Switch for Uber Mode. Geek-iness ostavljamo po strani, ali moramo priznati da AUSUM nije loša ideja. Osnovni BIOS je, zapravo, BIOS 2, u kome će kartica stizati do kupca. Na ovom BIOS-u,  Radeon HD6990 je podešen na 830 MHz za GPU i 5000 MHz za VRAM. Pozicija 1, odnosno BIOS 1 je onaj “strava” BIOS koji podiže limit unutar Overdrive sekcije u Catalyst drajverima, a samu karticu postavlja na 880 MHz. I to nije jedina razlika između ova dva moda, jer u drugom GPU-ovi rade na 1.12V, a u prvom na 1.175V, što je dosta viša vrednost. Ipak, za još ozbiljnije “klokovanje”, Cayman GPU se može “pržiti” i na 1.25V, ali preko toga baš i nije preporučljivo…


       

      Nažalost, memorija nije preterano ubzavana, pa u oba moda ostaje na 5000 MHz, efektivno, baš kao i kod Radeona HD6950. Pošto je memorija smeštena sa obe strane PCB-a (atenuacija šuma i smetnje unutar signala su veći) i s obzirom na to da je ima prilično mnogo (4GB), šanse za “najslabiju kariku” se povećavaju, pa mnogi primerci neće moći da rade na više od 5400-5500 MHz, što je, opet, default vrednost za VRAM na Radeon HD6970 modelu. Uz “labavije” podešavanje u PowerTune sekciji i smanjenja limita za maksimalnu količinu struje koju kartica može da povuče, AMD tvrdi da je moguće postići impresivne overclocking rezultate. U standardnom režimu, tzv. typical gaming power je 350W, a maksimalni 375W, dok su u OC / Turbo režimu ove vrednosti 415, odnosno 450W. Ako želite da testirate ili pak posedujete dve overklokovane Radeon HD6990 kartice u sistemu, morate računati na to da će samo video podsistem “vući” do 900W, pa je logično da će u tim situacijama biti potrebno napajanje od “barem” 1250W.
       


       

      Kada su konfiguracije Cayman GPU-ova u pitanju, tu imamo lepe vesti, jer su svih 1536 streaming processors jedinica u svakom čipu aktivni, baš kao i svih 96 TMU jedinica. To znači da ukupno, Antilles raspolaže sa 3072 SP unit-a i 192 teksturne jedinice. Kao što možete videti na slikama, PCB je prilično gusto napakovan, a osim za 45 stepeni rotiranih Caymana vidimo još čipova. 450-vatnog monstruma napaja masivna naponska sekcija koju kontroliše Volterra čip (VT1556), koji nam je poznat i sa Radeon HD6950 i HD6970 kartica. Ovaj čip je centralni deo PowerTune-a. Radeon HD6990 koristi iste memorijske GDDR5 čipove kao i Radeon HD6950. Proizveo ih je Hynix, a oznaka je H5GQ2H24MFR-T2C. Njihov “rating” je 1250 MHz (5000 MHz efektivno). Na slici iznad je vrlo uočljiv i PCI-Express bridge čip koji povezuje dva GPU-a putem standardnog PCI-Express 2.0 interfejsa. Ovaj čip proizvodi kompanija PLX, koja je i rebredirala sam čip za AMD. Identičan čip je korišten i kod Radeon HD 5970 Dual GPU akceleratora.
       

      Rashladni sistem je dosta kompleksan, ali nije rešenje koje bi se moglo nazvati potpuno novim. Sa zadnje strane kartice, uočavamo heat-spreadder koji rashlađuje 2 x 4 memorijska čipa koja se nalaze na toj strani PCB-a i čini karticu čvršćom i fizički štiti komponente od mogućeg oštećenja. Dakle, metalna ploča smeštena sa zadnje strane ima trojaku ulogu. U odnosu na kuler viđen kod Radeon HD5970 model, za svaki GPU su sada dodate “parne komore” koje su proslavile Sapphire i njihovu Vapor-X seriju kartica (a sada su deo “standardne opreme” kod Radeon HD6900 akceleratora). Dual Vapor Chamber sistem hladi jedan standardni ventilator, baš kao i onaj kod Radeon HD6950 i HD6970 kartica. Iako tunel kulera ima iste dimenzije kao i tunel kod pomenutih Single GPU Cayman kartica, AMD tvrdi da je uz unutrašnji redizajn postignuta do 20% bolja propusna moć vazduha.
       


       

      Kao što smo već pomenuli, AMD sada koristi i dosta kvalitetniju termalnu pastu za “povezivanje” svih dodirnih površina kulera sa komponentama na PCB-u, koju nazivaju “Phase-change TIM” (Thermal Insulation Material). Ova pasta bi trebalo da rezultuje i do 8% efikasnijem hlađenju u odnosu na standardnu, generičku termalnu pastu. Donji deo bakarnih vapor chamber jezgra je izuzetno dobro ispoliran. Tokom dužih igračkih sesija, Radeon HD6990 može postati nešto bučnija kartica, a u 3D režimu je svakako dosta bučnija od svojih “Single GPU” rođaka, što posebno važi za BIOS 1 mod, kada GPU radi na 880 MHz.
       

      Preporučena cena za Radeon HD6990 je 700 dolara, mada već vidimo da se ove cene koriguju naniže. U Evropi se Radeon HD6990 već može nabaviti za oko 500-ak evra, što je tek za nijansu više od GeForce GTX 580 modela. Unutar samog teksta nismo mogli da ubacimo sve fotografije, pa ćete ostatak njih moći da pogledate u okviru galerije koja se nalazi ispod članka.
       

      Test sistem

      PCI Express kartice smo testirali na test sistemu prikazanom u tabeli:
       

      Procesor

      Intel Core i7 920 @ 4000 MHz

      Matična ploča

      ASUS P6T Deluxe OC Palm Edition Intel X58 Chipset

      Memorija

      3 x 2Gb Geil PC2-16000 2000 MHz @1.65V

      Hard Disk

      Samsung SpinPoint F1, 320 GB, 16MB Cache
      Western Digital Caviar Black 7500 AALS, 750GB, 32MB Cache

      Video Karte

      NVIDIA GeForce cards tested on ForceWare 275 series of drivers
      AMD Radeon cards tested on Catalyst 11.2 + hotfix (Antilles tested on 11.4)
      Windows 7 x64 version of drivers, ofc.

      Monitor

      Samsung SyncMaster 244T / 245T

      Cooling, Case, PSU

      CoolerMaster Hyper Z600
      CoolerMaster Cosmos ESA 1010*
      CoolerMaster Ultimate Circuit Protection 1100W*
      * – ustupio Cooler Master

      DVD uređaj

      Optiarc DVD Recorder, SATA II

      Optički uređaj

      Pioneer Blu Ray reader

      Operativni sistem

      Windows 7 Enterprise Edition 64-bit

      Napomena:

      1. Pre testiranja smo u Catalyst i ForceWare drajverima podesili najviši nivo detalja (High Quality), isključili Catalyst A.I., a kod novih Cayman kartica smo PowerTune stavili na +20%.
      2. Radeon HD6990 je testiran na BIOS 2 podešavanju, dakle na skromnijih 830 / 5000 MHz.

      FutureMark 3DMark 11
       

      Poslednje izdanje 3DMark benchmarka može da se izvršava samo sa Direct X 11 kompatibilnim akceleratorima. Novi game testovi iz verzije “05” koriste Shader Model verzije 5.0 i DirectCompute 11. Nakon ne tako atraktivnog Vantage-a, 3DMark 11 ponovo izgleda fantastično, sa kompleksnim shader programima (mapiranje neravnina, tessellation, osvetljenja, emulacija pravog HDR osvetljenja, deffered shading, SSAO, particle efekti, dinamične i meke senke, subface scattering, napredni fog efekti (emulacija volumetric fluida), ali i dosta postprocesing efekata. Mi smo testirali u standardnim performance i extreme modovima, a po rezultatima se vidi da je novi 3DMark napravljen tako da još dugo bude interesantan i zahtevan benchmark program koji će dobrano opteretiti CPU i grafički podsistem.
       

      FutureMark 3DMark Vantage
       

      Iako nije toliko vizuelno impresivan kao njegovi prethodnici, 3DMark Vantage je zapravo dosta bolje osmišljen GPU i gaming benchmark uopšte. Pažnja je ovoga puta usmerena na funkcije koje se izvršavaju ili će se uskoro izvršavati unutar igračkih “endžina”, a ne na sam artwork. Prvi od dva grafička testa, Jane Nash (Graphics Test 1) testiraju simulaciju tečnih povšina i generisanih tekstura, kao i GPU-kalkulisane sisteme čestica, a u čitavoj sceni se u realnom vremenu u obzir uzimaju i uticaj gravitacije na objektima (pa i na “objektima” glavne junakinje), zakon inercije i impulsa sile (prva dva Njutnova zakona), kao i zakon akcije i reakcije, uz uticaj otpora vazduha. Fiziku kalkuliše GPU, a da sve ne bi ostalo samo na kalkulacijama “ispod”, 3D scena je opterećena brojnim dinamičkim izvorima osvetljenja sa kompleksnim senkama, a voda, koja je refleksivna i refraktivna, se ne pomera na predefinisan način, već se svaki talas u realnom vremenu i dinamički generiše. Drugi test, New Calico, podseća na igru X3:The Threat i ne sadrži objekte sa skinovima (bez zglobova), ali zato poseduje ogroman broj objekata u sceni, sa shadow mapama različitog tipa. Po prvi put u 3DMark benchmark programu, prisutni su i global raytracing efekti ((Parallax Occlusion Mapping, True Impostors i volumetric fog). Treći test pokušava da izmeri performanse CPU-a u kalkulacijama veštačke inteligencije i fizike. Broj “gejtova” kroz koje proleću avioni je srazmeran broju jezgara sistemskog procesora, a ako u sistemu posedujete i hardver za kalkulaciju fizike (PPU), ovaj broj se povećava za tri. Nakon, standardnih, na red dolaze i “sintetički” testovi: texture fillrate, color fillrate, paralax occlusion mapping, gpu clothing, particles, noise…
       

      Unigine DirectX 11 Heaven Benchmark 2.0

      Kompanije Unigine je predstavila svoj prvi DirectX 11 benchmark pod nazivom “Heaven”, koji koristi sopstveni 3D rendering engine, koji ima codepath za izvršavanje pod OpenGL, DirectX 9, 10 i 11 verzijama API-ja. Demo izgleda u najmanju ruku impresivno, te za sobom ubedljivo ostavlja sve što je FutureMark uradio u poslednjih nekoliko izdanja svojih benchmark programa. Kao i većina prvih DirectX 11 benchmark programa i igara, i “Heaven” u DX11 modu podržava i žestoko se oslanja na hardverski tesselation za prikaz izuzetno detaljnih površina na objektima, kao i naprednu implementaciju screen-space ambient occlusion (SSAO) tehnologije. Pored svega, tu su i volumetrijski efekti za prikaz detaljnih, realističnih oblaka. Posebno je interesantna opcija walk ili fly through, pa nam je izuzetno žao što ovaj demo nikad nije prerastao u neku igru. Mi smo koristili novu DirectX 11 verziju (2.0) koja ima još detaljniji “tesselation”…

      Call of Juarez: Bound in Blood benchmark

      Call of Juarez: Bound in Blood je multiplatformska TPS igra i nastavak čuvenog western hita istog naziva, koji je izašao samo za PC platformu. Pokreće ga četvrta generacija Chrome Engine-a, koja i u implementaciji za PC, ali i za Xbox 360 i PS3 podržava per-pixel metode osvetljenja i senčenja (normal mapping, virtual displacement mapping, environment mapping) kao i napredniju implementaciju deffered shading-a, doduše samo kroz DX10 verziju na PC platformi. Prikaz terena je realističniji nakon što je uveden poseban geo-mipmapping algoritam koji smanjuje broj poligona i žestoko se oslanja na height-map shader. Postprocessing efekti uključuju i maksimalno 64-bitni HDR, dinamičke i statičke meke senke, full screen motion blur, bloom, glow, depth-of-field, ambient occlusion, tone-mapping, edge AA, itd. Mi smo testirali kroz prvi “built-in” test, uz maksimalan nivo detalja, u DirectX10 okruženju. Pogledajmo rezultate:

      Call of Duty: Modern Warfare 2

      Call of Duty: Modern Warfare 2 je sledeća u nizu modernih arkadnih simulacija građanskih ratova i drugih političkih i verskih okršaja širom planete zemlje. Baziran je na unapređenom “motoru” svojih prethodnika, posebno verzija World at War i Modern Warfare. Broj detalja odnosno dešavanja u sceni u svakom trenutku je izuzetno veliki, bilo da su u pitanju sitnice poput mapiranja neravnina, bloom i HDR efekti, dinamičke senke i osvetljenja, efekti eksplozija i dima ili sveprisutni depth-of-field tokom zumiranja. U igri svaki metak prolazi kroz materijale kroz koje bi prošao i u realnoj borbi (drvo, staklo, tanak metal), uz adekvatno usporenje i izmenu pravca. Igra koristi DirectX 9.0 i DirectX 10, a mi smo, naravno, testirali sa najvišim brojem detalja. Pogledajmo rezultate:
       

      Resident Evil 5 benchmark
       

      Ova survival horror igra je inicijalno razvijena za Xbox 360 i PlayStation 3, a nedavno se pojavio i Benchmark Demo za PC, ali i kompletna igra. Razvojni tim Capcom stoji iza naslova kakvi su Lost Planet i serijal Onimusha, pa je jasno da je grafička prezentacija na visokom nivou, a posebne reči hvale se mogu uputiti za optimizaciju, jer je ova igra, kao jedna od najlepših akcionih arkadnih igara ovog tipa na PC plaformi istovremeno i jedna od najmanje zahtevnih. Engine se oslanja uglavnom na funkcije DirectX 9.0c API-ja, mada igra zvanično podržava DirectX 10, ali ne koristi njegove napredne mogućnosti. Na PC platformi, igra podržava i GeForce 3D vision sistem naočara koji omogućava dublji “immersion” u samu igru. U benchmark demou, koji je izašao mesecima pre same igre, sva podešavanja smo postavili na maksimum i testirali sa i bez anisotropic i antialiasing filtera. Testirali smo DirectX 10 verziju. Pogledajmo rezultate:
       

      Warhammer 40.000: Dawn of War II
       

      Dawn of War II je strateška i role-play igra smeštena u Warhammer 40,000 univerzumu i bazirana je na Essence 2.0 verziji engine-a. Prethodna verzija je pogonila igre Company of Heroes sa nastavcima (Opposing Fronts i Tales of Valor), a mi smo istu koristili nekoliko godina. Aktuelna verzija, Essence 2.0 donosi mnoge nove tehnologije, pa i Dawn of War II izgleda znatno atraktivnije od pomenutih prethodnika. Tako je sada u engine-u podrška za High Dynamic Range osvetljenje, dinamičko osvetljavanje i senčenje, normal mapping i napredna skeletalna animacija. Takođe, Dawn of War II je prva RTS strateška igra koja je donela i detaljan prikaz lica pri većem zoom-u na boljno polje, tu uključujući i facijalne animacije! Naravno, mi smo koristili najzahtevnija podešavanja u okviru same igre, koja poseduje i sopstvenu benchmark skriptu.

      BattleForge

      Umesto serijala BattleField i njegovih brojnih nastavaka, ovoga puta smo se odlučili da koristimo nešto adekvatniju igru za merenje performansi modernih grafičkih akceleratora. U pitanju je BattleForge, igra koju je razvio Phenomic, koji je zaslužan i za fenomenalni Spellforce RTS-RPG serijal igara. Igra je, kao i njeni prethodnici u svoje vreme, izuzetno napredna i atraktivna, a oslanja se na DirectX 10.1, što donosi i podršku za osnovnu verziju SSAO. Unutar igre postoji i benchmark demo, koji je prilično zahtevan, čak i za ono što ćete tokom igranja iste igre iskusiti (ako se neko seća Quake III Crusher demoa, zna na šta mislimo), jer je u sceni fenomenalan broj jedinica sa puno detalja, detaljne teksture, povremeni normal mapping, parallax mapping, dinamičko osvetljenje i senke, pomenuti SSAO, te post processing efekti. Igru smo testirali na najvišim setovanjima:

      Far Cry 2

      Nastavak jedne od najimpresivnijih igara svog vremena, fenomenalnog FarCry-a, koristi posebno razvijani Dunia Engine. Ovaj engine podržava sve moderne efekte DirectX 9.0c API-ja za prikaz grafike, ali i napredne mogućnosti kao što su destruktivni teren i objekti, dinamičko širenje vatre u odnosu na vremenske uslove i vetar, specijalne atmosferske efekte (realne simulacije oluje), izmene dana i noći, napredni ne-skriptovani A.I. Engine podržava DirectX 9.0c, ali i DirectX 10, a posebna pažnja pri njegovom razvoju poklonjena je optimizaciji za Xenos GPU na Xbox 360 konzoli. Generalno, Dunia Engine implementiran u Far Cry 2 jeste manje grafički zahtevan of Cry Engine 2 “motora” koji se koristi u igrama Crysis i Crysis Warhead. Mi smo koristili maksimalan nivo detalja, plus dodatnu modifikaciju za dalje iscrtavanje detaljnijih objekata (povećan ukupan LOD) i kompletne 3D vegetacije na daljim udaljenostima od “kamere”.

      Crysis Warhead

      Šta reći o najdetaljnijoj, grafički najimpresivnijoj igri i najzahtevnijoj igri današnjice – Crysis – ili o njenoj kraćoj, ali još intenzivnijoj stand-alone ekspanziji – Crysis Warhead?. U odnosu na bilo koju drugu igru koja vam može pasti na pamet – Crysis uz najviša setovanja izgleda bar za dva koplja iznad, što je iznenađujuće za naslov koji puni svoju treću godinu postojanja na tržištu. Tokom testiranja smo koristili Ultra Quality Screenshot Config podešavanja aktuelnog CCC mod-a (bez Time of Day modifikacije), koji omogućava još veću daljinu iscrtavanja, veći broj dinamičkih osvetljenja i senki, precizniji enviroinment mapping i refleksije. Osim toga, vredi napomenuti da je u pitanju apdejtovana, 1.21 verzija igre koja je donela i 64-bitni Crysis.exe fajl, pa je tako i Crysis Warhead testiran pod DX10/Windows 7 okruženjem, naravno, baš sa ovom verzijom same aplikacije.

      Left 4 Dead 2

      Nama veoma drag serijal Half Life, zamenili smo modernijom i intenzivnijom surival-horor akcionom igrom, koja poseduje ugrađeni benchmark demo. Left 4 Dead 2 je poslednji hit iz Valve radionice, a kao i njegov prethodnik, izrađen oko poboljšane verzije Source 2.0 endžina, korištenog još i u poslednjoj HL2 Episode 2 igri. Igra je smeštena u apokaliptičnu blisku budućnost, nakon pandemije virusa koji je veći deo planete pretvorio u zombije na stereoidima, dok je deo preživelih ostavio da rade upravo to – preživljavaju. Igra je najzanimljivija u kooperativnom multiplejer režimu, koji se može igrati kao versus mod (slično deathmatchu) ili kao co-op kampanja. Poboljšanja na Source “motoru” obuhvataju bolju podršku za višejezgarne procesore, animacija koja se oslanja na integrisani fizički endžin, prilično je dorađen i AI, a dodate su i novine koje nismo viđali u Half Life igrama, kakvi su self-shadowing, normal mapping i veliki broj post-processing trikova koje Valve objedinjuje pod nazivom cinematic visual effects (color contrast, sharpening, multi-focusing, film grain, vignetting itd.). Pogledajmo rezultate koje smo postigli uz najviši nivo detalja.

      S.T.A.L.K.E.R: Call of Pripyat

      Nakon izlaska naslova S.T.A.L.K.E.R.: Shadow of Chernobyl i Clear Sky, ukrajinski razvojni tim GSC Game World se ponovo okušao u oživljavanju Zone, kroz poslednje izdanje iz serijala: Call of Pripyat Clear Sky. Ovoga puta, kontaminirana teritorija pod nazivom Zona izgleda još impresivnije nego ranije, jer nova verzija engine-a podržava neke od najnaprednijih i najzanimljivijih DirectX 11 specijaliteta. Pored mnogobrojnih novih i starih efekata poput smene dana i noći, realističnih sunčevih zraka, kiše, munja, mokrih materijala, tu su sada i impresivni High Definition Ambient Occlusion (HDAO), zatim realističniji modeli zahvaljujući hardverskoj podršci za Tesselated Game Characters, ali i posebni DX11 Contact Hardening Shadows. HDAO omogućava da ambijentalna svetlost realistično prodre i do prostora u kome nema direktnog izvora svetlosti, te rasipa baš kao i u realnom svetu, ali bez implementacije zahtevnih radiosity senčenja. Uz per-sub-pixel preciznost izvršavanja shader rutina, “Zona” nikad nije izgledala realnije. Mi smo koristili demo koji je posebno kreiran samo za testiranje performansi grafičkog podsistema.

      Colin McRae DIRT2

      Još arkadniji i dodatno udaljen od “realnosti” kojima je nekada, bar na momente težio originalni Colin McRae naslov, DiRT 2 koncipiran je slično kao i drugi Codemasters-ov hit, (GRID), sa kojim deli i engine na koji se oslanja. Ego, unapređena verzija Neon endžina, korištena u prvom DiRT-u (1997.), donosi realističniji “damage model”, preciznije osvetljenje i sistem senki, a usput je dosta bolje optimizovan od prethodnika, posebno kada je multi-threading u pitanju. Igra je inicijalno razvijana za Xbox360, ali je u odnosu na ovu verziju posebno poboljšana i dorađena za DirectX 11 kartice, pa je tu podrška za sistem koji povećava broj poligona, što se posebno dobro vidi na efektima talasanja vode i pojedinim animiranim modelima i površinama u igri. Nakon primene modernih motion blur, bloom, HDR i drugih post-processing efekata, igra zaista izgleda fenomenalno. Mi smo sve opcije postavili na maksimum. Pogledajmo rezultate:

      Tom Clancy's H.A.W.X 2.

      H.A.W.X 2 je borbena avio simulacija arkadnog tipa, koja poseduje i priču koju je osmislio čuveni američki pisac Tom Clancy, direktni krivac za veliki uspeh hit serijala kakvi su Rainbow Six, Ghost Recon, Splinter Cell i EndWar. Radnja koja prati tok igre, prepliće se upravo sa naslovima Tom Clancy's Ghost Recon Advanced Warfighter 1 i 2, kao i RTS igrom EndWar. H.A.W.X poseduje dva moda – safe (ERS) i advanced (ERS off), pri čemu je ovaj drugi i vizuelno dosta atraktivniji, ali i za nijansu realniji (avioni dosta lakše padaju u kovitlac). Ipak, treba znati da igra predstavlja najčistiju moguću arkadu, jer sa avionima ne možete nigde sleteti, ali ni usporiti ispod 900 km/h, čak ni sa onim koji to u realnosti mogu (npr. Sea Harrier britanske mornarice). Modeli aviona su vrlo detaljni, a teksture i okolina skoro foto-realistični (korištene su GeoEye Earth-imaging IKONOS mape). Sama igra je prilično dobro optimizovana, pogotovo ako je pokrenete u DirectX 10.1 modu (na odgovarajućoj kartici, naravno), a mi smo testirali na najvišem nivou detalja.

      Metro 2033

      Kao i S.T.A.L.K.E.R, i ovo je jedna od igara koja dolazi iz “istočnog bloka”, jer su na njoj radili programeri i dizajneri zaduženi baš za pomenuti naslov, okupljeni u novom timu (4A Games). Igru pokreće moćni engine koji je portovan i za Xbox 360, PlayStation 3, ali je u startu razvijan za Windows platformu. Prema onome što se zna, engine ima dosta toga zajedničkog sa poslednjom iteracijom X-Ray “motora” koji je korišten za igru S.T.A.L.K.E.R.: Shadow of Chernobyl, a u verziji za PC podržava i NVIDIA PhysX i DirectX 11. Sama igra Metro 2033 izgleda značajno bolje na high-end PC računaru nego u verzijama za konzolu, pa osim realističnih senki i osvetljenja, velikih tekstura i uverljivih efekata kiše, munja i različitih materijala i podloga, tu su ponovo i impresivni High Definition Ambient Occlusion (HDAO), te ultra-detaljni modeli na kojima je primenjen “tesselation”, posebne DX11 senke itd. Mi smo, naravno, uključili sve što je bilo moguće i krenuli u testiranje…

      Just Cause 2

      Just Cause 2 je sand-box igra razvijana za PC, Xbox 360 i PS3, ali koja nije samo još jedna prosečna multiplatforma koja izgleda veoma slično na sve tri igračke konzole. Avalance Engine 2.0 je veoma skalabilan, pa na igračkim konzolama izgleda prilično dobro, ali rudimentarno u odnosu na vizuelnu raskoš koja se postiže na jakim PC računarima sa akceleratorima koji podržavaju DirectX 11. Osim ogromnih prostranstava kakvi do sada nisu viđani u jednoj PC igri, a koji se sasvim slobodno mogu uporediti sa prostorno znatno manjim Crysis mapama, Just Cause 2 nudi i daleko bolju optimizovanost, te brz i tečan realtime rendering realističnih senki i osvetljenja, sve sa velikim i detaljnim modelima i teksturama, kao i uverljivim efektima eksplozija, dima, magle, te meteoroloških uslova… Tu su, naravno i impresivni DOF, realističan haze i subsurface scattering, kao i SSAO, dok vodene površine podržavaju i DX11 “tesselation”. Testirali smo sa maksimalnim detaljima…

      Bonus igra – StarCraft II

      Bonus igra – Mafia II

      Bonus igra – Aliens vs. Predator

      Overclocking

      Koristili smo, naravno, “overklokerski” bios koji volt-moduje karticu, kako ne bismo imali problema da postignemo “klok” od 950 MHz za GPU, što se i ostvarilo. Memorija nije mogla da ide više od 100 MHz iznad default-a, odnosno 400 MHz efektivno, što je opet dobar rezultat za čak 4 GB memorije koja u startu radi na 5 GHz. Kada budemo imali više vremena i Radeon HD6990 nekog drugog proizvođača, malo ćemo se više poigrati sa overklok-om…


       

      Pogledajmo i rezultate:

       

      Zaključak

      Nema nikakve sumnje da je Radeon HD6990 najbrži akcelerator na planeti. Bez obzira na igru ili podešavanje, ova kartica izbija na prvo mesto u svakoj kategoriji, što mu omogućavaju dva Cayman GPU-a i fantastičnih 4 GB veoma brze GDDR5 memorije. Još je zanimljivije to što smo karticu testirali na nižem “kloku”, jer smo želeli da ostavimo nešto i za narednu priliku i neki od testova Antilles kartice koja će imati i bolje hlađenje, ali i još impresivniju overclock marginu. Za Radeon HD6990 nikakva opasnost nisu GeForce GTX 580 akceleratori, a primetno je brži od prethodnika (Radeon HD5970) i Single GPU izdanja (Radeon HD6970). AMD će na ovoj poziciji biti siguran još samo nedelju-dve dana, jer će se nakon toga pojaviti i Dual Fermi 2 GPU, odnosno GeForce GTX 590 akcelerator.

      Radeon HD6990 nije igračka za svakoga, jer se radi o rešenju koje je napravljeno da obara rekorde i postavlja nove standarde. U otključanom režimu, kada je PowerTune restrikcija isključena, a BIOS switch na poziciji “jedan” i uz dodatni overclock, Radeon HD6990 je ekstreman potrošač. Njegova cena od oko 550 evra nije toliko ekstremna, jer moramo priznati da nudi impresivne performanse, a znamo i da će Dual GF110 biti znatno skuplji od nje. Drajveri su zaista dosta “ispeglaniji” u odnosu na vreme kada su se pojavili Radeon HD4870 X2 ili čak HD 5970, pa je i Crossfire skaliranje znatno adekvatnije. Postoje slučajevi u kojima je Radeon HD6990 tačno dva puta brži od Radeona HD6970, od koga je Antilles u proseku brži više od 65%. Iako je Radeon HD6970 uglavnom sporiji i od GeForce GTX 570 akceleratora i nikako ne može da parira najbržem GeForce GTX 580, nakon onoga što je demonstrirao Antilles, jasno je da je Crossfire dostigao svoju punu zrelost… U odnosu na GeForce GTX 580, od koga novi Radeon HD6990 nije baš toliko skuplji, vidljivo ubrzanje, opet u proseku, iznosi bar 35%, što nije zanemarljiva cifra ako znamo da je GeForce GTX 580 zaista brza kartica. Jedna od mana ovog prozivoda može biti nešto bučniji ventilator, ali verujemo da će rešenja iz kompanija kao što su ASUS, MSI, Gigabyte ili Sapphire imati efikasnije i tiše rashladne sisteme.


      AMD Radeon HD6990 – Benchmark Highly Recommended Award
       

      Ova kartica se može povezati na čak pet monitora, a uz njih će se isporučivati i svi neophodni video adapteri, što je veliki plus, s obzirom na to da njihova cena nikako nije zanemarljiva. Iako je njena početna cena bila veća od cene dve Radeon HD6970 kartice, trenutno je dosta manja i u rangu sa sumom koju je potrebno izdvojiti za dva Radeon HD6950 akceleratora. Kada je Radeon HD6990 u pitanju, još uvek nismo doneli konačan zaključak. Potrebno je da ga istestiramo i na bržem BIOS modu i vidimo kakve će kartice proizvoditi i prodavati partneri i na kojim će radnim učestanostima one dolaziti. Potrebno je videti koliko kartica pruža u EyeFinity modovima i u XHD rezolucijama u odnosu na konkurenciju. Ipak, dovoljno znamo da bismo mogli da je preporučimo svakom ultra-zahtevnom igraču ili overklokeru…

      Karticu na test ustupio AMD.

      Ostani u toku

      Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

      Hvala!

      Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

      Možda vam se svidi
      X870E Aorus Pro i X870 Aorus Elite Wi-Fi7 test