AMD Radeon HD6900 serija
Uvod
Čini se da smo tek pre nekoliko nedelja bili u sunčanoj Kaliforniji, gde je AMD predstavio svoju sweet spot seriju kartica, Radeon HD6800, baziranu na Barts grafičkom procesoru. Tada smo dobili prve informacije o Radeon HD6900 seriji, koja bi trebalo da bude pravi naslednik Radeon HD5800 serije (Cypress GPU) u smislu da će ponuditi daleko više performanse, koje se i očekuju od naredne generacije. Radeon HD6950 i HD6970 kartice su malo odložene – prvobitni datum predstavljanja je trebalo da bude 22. novembar. U tih (pre)dugih mesec dana, NVIDIA je uspela da predstavi naslednika GeForce GTX 480 i GTX 470 akceleratora – modele GTX 580 i GTX 570, koji su se pokazali i bolje nego što je očekivano, najpre zbog sada zaista sazrelog 40-nm litografskog proizvodnog postupka u TSMC-u.
O Cayman čipu i Radeon HD6900 seriji akceleratora se diskutuje još od kako su se pojavile Barts bazirane kartice. Radeon HD6870 i HD6850 su po cenama zamenili modele HD5850 i HD5830, a doneli su nižu potrošnju, tiši rad i više performanse. Cene su, u međuvremenu, još pale, pa su trenutno Barts kartice najbolje kupovine u klasi. GeForce GTX 570 i GTX 580, koji su se tek pojavile, zauzimaju znatno više klase, a AMD sa Cayman modelima upravo cilja taj “prostor” – između 300 i 400 američkih dolara. Za Cayman arhitekturu se znalo isuviše malo, pa je bio predmet nagađanja, od broja jedinica, do organizacije samih ALU jedinica unutar shadera, sve do priče o veličini čipa i njegovoj teoretskoj matematičkoj “snazi”. Cayman jeste zamena za Cypress GPU, ali se ovoga puta zadržavamo na 40-nm postupku, a ako je AMD nešto naučio iz svog i lošeg iskustva konkurenta, jeste da ne treba kreirati previše veliki, monolitni GPU, koji će biti izazov za proizvodnju i koji će, samim tim, biti slabo ekonomski isplativ. To ipak ne znači da se od Caymana očekivalo malo. Štaviše, od Cayman Pro i XT kartica smo i lično očekivali da nadmaši performanse GeForce GTX 470 i GTX 480 modela, a kako su se, u međuvremenu pojavili naslednici, izgledalo nam je logično da će Radeon HD6950 i HD6970 ponuditi slične performanse. Da bismo odgovorili na ovo pitanje, moramo da prođemo dug put do zaključka ovog teksta, a pre toga ćemo, naravno, popričati i o čuvenim izmenama u arhitekturi kod Cayman GPU-a u odnosu na Barts i Cypress serije. Stoga vam preporučujemo da pogledate naš inicijalni test Radeon HD6850 i HD6870 karticakao i stariji tekst o Radeon HD5800 GPU arhitekturi.
Porsche… Pardon, AMD Cayman
Cayman je AMD-ov novi grafički procesor koji “pogoni” tzv. enthusiast seriju kartica – Radeon HD6900, odnosno modele Radeon HD6950 (Cayman Pro), Radeon HD6970 (Cayman XT) i, kako se očekuje, Radeon HD6990 (Dual Cayman, odnosno Antilles). Radeon HD6990 još uvek nije zvanično najavljen, pa o njemu više nećemo pričati, a više informacija bi trebalo da imamo već u drugoj polovini januara. Iznenađenje će vas sačekati već u startu – najjači model koji je AMD danas predstavio, Radeon HD6970, cenovno je pozicioniran ne ka GeForce GTX 580, već prema slabijem GTX 570 modelu, sa preporučenom cenom od oko 370 dolara, odnosno 350-360 evra na našem tržištu. Radeon HD6950 ima MSRP od 299 dolara, što će kod nas rezultovati cenom od 280 evra, što ga svrstava u klasu između starih GTX 470 i GTX 480 modela. Šuška se i o Radeon HD6950 kartici sa jednim gigabajtom GDDR5 memorije, koja bi trebalo da bude i još jeftinija, a koja bi tako obesmislila pojavljivanje nekog Radeon HD6930 modela (mada, nemojte da nas držite za reč – ništa nije nemoguće).
Cayman GPU je, dakle, pravi naslednik Cypress modela, pa se od njega i očekuju više performanse u klasi koju su Radeon HD5850 i HD5870 modeli zauzimali kada su se prvi put pojavili na tržištu. Radeon HD6970 je, trenutno, najjači Single GPU akcelerator koji AMD ima u ponudi, a prva stvar koju će svako uočiti kada pogleda specifikacije je činjenica da Cayman ima manji broj shader jedinica i jednak broj ROP (render back-end) unit-a. S druge strane, novi GPU ima dual SIMD jedinice, pojačanu TMU (texture management unit) sekciju, kao i čitava dva gigabajta ultra-brze GDDR5 memorije.
Kompanija koja proizvodi grafičke procesore za AMD i NVIDIA-u se i predugo zadržala na 40-nm procesu, što je stvorilo dosta problema za nekadašnje planove koje su, nesumnjivo, imala oba ova GPU dizajnera. AMD je izmenio sopstvene planove tako što je skalirao Cypress GPU i kreirao Barts sa optimizovanom Evergreen arhitekturom i iskoristio sazrelost 40-nm procesa da postigne iste ili slične performanse sa manjim čipom, koji će se, logično, prodavati po nižoj ceni. Tako je nastala Radeon HD6800 serija, dok je HD5700 serija zadržana iz prethodne generacije (i AMD se nije odlučio da joj promeni oznaku i rebrendira je, što je omražena praksa konkurentskog proizvođača). Videvši da će se još neko vreme zadržati u 40-nm “dvorištu”, AMD je odlučio da “isproba” i nešto noviju (ili bar drugačiju) arhitekturu i kreira Cayman – GPU koji nije mnogo veći od Cypress-a, ali koji je znatno efikasniji u igrama. Cayman je trebalo da bude 32-nm čip, ali ga je AMD kreirao u sada već sazrelom 40-nm procesu, iako smo u razgovoru sa Erikom Demersom saznali da je ova odluka ipak koštala Cayman “nekih zanimljivih funkcija”. Osim nekih stvari o kojima se pričalo ranije, a to je broj shader jedinica koji se kretao oko cifre od 2000, nešto složenijeg (većeg) memorijskog kontrolera i kompatibilnosti sa PCI Express 3.0 logikom, sve ostale priče su čista spekulacija. Zato ni mi sa sigurnošću ne možemo da kažemo da li se radi o funkcionalnim celinama koji se čuvaju sa 28-nm die-shrink (Radeon HD7900) Caymana ili pak količini shader jedinica, a možda i zato GPU koji danas predstavljamo na papiru i ne nudi (mnogo) veću processing moć od Cypress-a. Ipak, videćemo da su u igrama Radeon HD6900 kartice daleko brže od Radeon HD5800 modela.
Ako pogledamo grafikon iznad, verujemo da će mnogi pomisliti da dosta liči na Cypress i Barts. Istina, organizacija blokova i jedinica je ostala veoma slična, ali su najveće promene napravljene na nivou svake od tih jedinica. Neke su dosta izmenjene, a neke samo onoliko koliko je bilo potrebno. Ipak, svaka od njih je sada dosta efikasnija u onome što radi.
Površina GPU-a je 389 kvadratnih milimetara, što ga više ne svrstava u rang malih čipova, ali je ipak znatno manji od GF100 ili čak GF110. Po površini se približio omraženom R600 GPU-u, poslednjem monolitnom čipu kompanije ATI (pre nego što ih je AMD uzeo pod svoje i, na svu sreću, primenio novu poslovnu strategiju). Cayman GPU ima 500 miliona tranzistora više od Cypress-a – čak 2.64 milijarde, što je za 29% više, dok je površina GPU-a svega 16% veća.
Dual Engine
Cayman-ov layout, kao što smo rekli, podseća na one već viđene kod Barts-a i Cypress-a. GPU ima ukupno 24 SIMD-a u raspoređena u dva odvojena “jezgra” ili bloka. Svaki SIMD ima sopstvenu teksturnu jedinicu, kao i posvećenu L1 texture cache jedinicu. Tu su i četiri 64-bitna memorijska kontrolera, svaki sa sopstvenom L2 keš memorijom i dva render back-end unit-a. Cypress arhitektura podrazumeva jedan command procesor, jedan unificirani grafički “engine” i jednu Ultra Threaded Dispatch jedinicu koja raspoređuje thread-ove u SIMD engine, koji obuhvata shader, TMU i L1 cache jedinice. Cayman i dalje ima jedan osnovni command processor, ali su pomenute jedinice koje čine Single Instruction Multiple Data engine, podeljene u dva SIMD bloka, a svakoj je dodeljena poseban Ultra Threaded Dispatch Processor. Ovom podelom u arhktekturi, kreiranjem dva unified graphics engine-a, kao i dupliranjem keš i dispatch jedinica, omogućena je obrada dve različite primitive po kloku, povećana efikasnost tessellator jedinica, ubrzano procesiranje geometrije (vertex podataka) i efikasnije pozivanje dispatch jedinice. Samo razdvajanje rasterizatora omogućilo je procesiranje do 30 piksela po kloku. Dual Rasterizers sada podrazumevaju i postojanje dve odvojene, specijalizovane fixed function jedinice. Cypress je, kao što smo rekli, imao jedan unified graphics engine i jedan ultra threaded dispatch procesor, dok je Barts bio “na pola puta” ka Cayman dizajnu – imao je jedan unified graphics engine, ali i odvojene ultra threaded dispatch jedinice za svaki SIMD blok. Na ovoj stranici možete pogledati blok dijagram za Barts i Cypress, kao i objašnjenje u čemu se razlikuju.
VLIW4 – jednostavnije je bolje
Kao što znamo, VLIW5 arhitektura podrazumeva SIMD jedinicu koja je kontrolisana putem komande koja se naziva very long instruction word, a koja može da obuhvati šest instukcija – pet matematičkih i jednu branching instrukciju. Ova komanda, VLIW kontroliše čitav SIMD blok ALU jedinica, koje rade na istom ili srodnom thread-u u datom trenutku. SIMD jedinice izvršavaju svaki thread paralelno i to na više elementarnih nivoa (5 matematičkih operacija uz obavezan flow control). Zato se kaže da je dizajn Cypress i Barts GPU-ova “VLIW5” tipa. Unutar svakog shader programa postoji specijalna instrukcija koja kontroliše, odnosno opisuje kako bi kod trebalo da se izvrši pod određenim (važećim) uslovima. Niz ovih instrukcija kroz nekoliko povezanih ili jedan (veći) shader program se zajedno nazivaju – flow control. Zahvaljujući preciznom Dispatch Processoru i već pomenutim arbitrima, sve operacije unutar jednog thread-a se izvršavaju paralelno kroz celu SIMD jedinicu, uz napomenu da se Texture i Vertex Fetch operacije prosleđuju i izvršavaju odvojeno.
VLIW5 arhitektura je podrazumevala i da se unutar shader bloka nalaze četiri ALU (shader) jedinice koje obrađuju standardne funkcije, dok je peti ALU (nazivan još i “special, T-unit”) bio u stanju da obrađuje specijalne, trigonometrijske funkcije (sin, cos, log, exp). Izvršne jedinice su povezane sa drugim takvim jedinicama unutar susednih SIMD-ova (uz osam obaveznih ciklusa kašnjenja, koji su „prepleteni“ pa je efektivna latencija svega četiri ciklusa).
Deljenje instrukcija unutar VLIW5 ALU arhitekture nikad nije jednostavan posao i gotovo je nemoguće postići apsolutnu efikasnost – specijalne funkcije, u odnosu na one standardne ne dolaze uvek u odnosu 4 : 1, pa se tako jako često dešava da kompajler ne može da podeli posao na najbolji mogući način, te neke od ALU jedinica stoje nezaposlene. Cayman ima VLIW4 SPU blok sa četiri ALU jedinice od kojih svaka može da izvršava specijalne, transcendentne matematičke funkcije. Osim što su univerzalnije, SPU jedinice su i jednostavnije, pa je lakše podeliti posao na četiri ALU-a, nego na pet. AMD čak navodi da je na ovaj način povećana efikasnost u toj meri da su performanse po kvadratnom milimetru GPU-a veće i do 10%.
Od poboljšanja kod nove arhitekture neće samo imati koristi igrači, jer je Cayman efikasniji i kao general purpose computing procesor. Odnos efikasnosti prilikom izvršavanja double-precision floating-point kalkulacija više nema odnos od jedne petine izvršavanja single-precision instrukcije, već je u povoljnijem odnosu od jedan prema četiri. Sada ćemo pogledati kako se izvršavaju različiti tipovi kalkulacija unutar VLIW5, a kako unutar VLIW4 organizovanih SPU-ova:
VLIW5 u jednom klok ciklusu izvršava:
Četiri 32-bit FP MAD (Floating Point, Multiply/Add) instrukcije
Ili dve 64-bit FP MUL (Multiply) ili ADD instrukcije
Ili jednu 64-bit FP MAD instrukciju
Ili četiri 24-bit Int (Integer) MUL ili ADD instrukcije
U svakoj od prethodne četiri, paralelno se izvršava jedna transcendentalna (sin, cos, exp…) funkcija ili još jednu 32-bit FP MAD instrukcija (kao pod 1.)
VLIW4 u jednom klok ciklusu izvršava:
Četiri 32-bit FP MAD/MUL/ADD (Multiply/Add, Multiply/Add) instrukcije
Ili dve 2 64-bit FP ADD instrukcije
Ili jednu 64-bit FP MAD/FMA/MUL instrukcije
Ili četiri 24-bit INT (Integer) MAD/MUL/ADD instrukcije
Ili četiri 32-bit INT ADD/Bitwise instrukcije
Ili jednu 32-bit MAD/MUL instrukciju
Ili jednu 64-bit ADD instrukciju
Ili jednu transcendentalnu, plus još jednu 32-bit FP MAD instrukciju (za transcendentalnu su potrebna tri od četiri ALU-a u SPU-u)
Zbog čega se ATI toliko dugo držao VLIW5 arhitekture?
VLIW5 dizajn shader jedinica datira još iz vremena prvog GPU-a koji je imao programabilne pixel i vertex shader jedinice. Za procesiranje vertex shader programa, VLIW5 je bio odličan izbor – četiri ALU jedinice će procesirati poziciju i boju piksela (x, y, z, c), dok će posebna jedinica obraditi pripremu za osvetljenje. Kada su se pojavili prvi unified shader GPU-ovi (R600), VLIW5 je još uvek bio dobar izbor za jednostavnije i kraće DX9 shader programe. U to vreme je stream computing i GPGPU još uvek bio mrtvo slovo na papiru.
Međutim, kada je dizajniran Cypress, a onda i njegovi naslednici, situacija sa igrama i general purpose computing-om se dosta promenila. Kompleksniji shader programi unutar igara (DX10 i DX11 generacija) više se nisu izvršavale sa istom efikasnošću kao tokom DX8 i DX9 generacija. Obrada podataka koje daje kompajler tokom rada sa dispatch jedinicom daje informaciju da se T-unit unutar svakog SPU-a koristi u manje od 8% situacija (ako se posmatra totalni prosek, naravno), tj. da 92% vremena stoji neiskorišten. Za GPGPU computing se odavno znalo da bi radio efikasnije uz VLIW4, ali je statistika iz kompajlera pokazala da je to slučaj i sa igrama. Tada je tim Erika Demersa već znao da je vreme da se pređe na VLIW4. Iako se, za to, inicijalno čekao 32nm proces, odlučeno je, kao što smo već pisali, da i 40nm Cayman “pređe” na ovaj dizajn.
VLIW4 deeper dive
Kao što vidite u spisku funkcija iznad, VLIW4 SPU može da izvrši četiri matematičke Integer ili FP operacije, dok VLIW5 može da ih izvrši pet. U slučaju da mora da se izvrši transcendentna operacija, VLIW4 SPU mora da iskoristi tri ALU-a da bi izvršio jednu ovakvu funkciju, što ostavlja taj konkretni SPU u istom ciklusu slobodnim da izvrši samo jednu Integer ili FP operaciju. U takvom slučaju, VLIW5 može da izvrši čak četiri Int/FP operacije + transcendentalnu funkciju, što mu daje veliku prednost. Pa ipak, takve situacije se u vreme GP-GPU computinga i DX10 i DX11 igara ne dešava toliko često, pa je češća pojava da T-unit stoji neuposlen. Kada se isti izbaci, dodatni broj tranzistora se može iskoristiti za postavljanje više VLIW4 SIMD jedinica. Tako Cayman ima 24 VLIW4 SIMD jedinice, dok Cypress ima 20 VLIW5 jedinica. U teoriji, zato, po sirovoj computing propusnoj moći, Cypress ne ostaje toliko za Caymanom, ali je u realnom radu sa aktuelnim softverom, ipak efikasniji, jer su mu SIMD jedinice uposlenije. AMD navodi da je novi GPU i do 10% efikasniji po kvadratnom milimetru u odnosu na Cypress, što nije zanemarljiv podatak. Kao što smo gore i pomenuli – svaka od SP jedinica je uposlenija, a kompajler sada više ne mora da “pravi razliku” između običnih i specijalne, T-jedinice.
Erik Demers nam je ispričao da AMD još uvek (pre dva meseca) nije bio siguran u to da li će i sledeća generacija GPU-ova srednje i performance klase (naslednik Junipera, pa i Barts-a) biti VLIW4 tipa. Sasvim je moguće da će VLIW5 biti prisutan i kod Radeon HD6700 i HD7800 serije kartica, a da će VLIW4 u “još jednom krugu” biti rezervisan za najvišu klasu (naslednik Caymana tj. HD7900 serija). Osim toga, tim Terija Makedona već ima pune ruke posla sa izbacivanjem novih profila (na nedeljnoj bazi) za nove naslove, ali pravi “koderi” trenutno ponajviše rade na optimizaciji shader compilera koji radi sa Dispatch jedinicom i to na tome da one budu efikasnije u radu sa VLIW4 SIMD-ovima.
Shaderi, TMU, ROP…
Kao što smo već pomenuli, prethodnik Caymana je imao jedan graphics engine koji čini rasterizer, hierarchical-z, teselator jedinica i asembler jedinica za geometry i vertex shading. Cypress je imao poboljšan graphics engine – dual rasterizer i dual hierarchical-Z koji su omogućili obradu 32 piksela po kloku (ranije je bilo moguće “provući” 16). To je bio prvi korak ka “dupliranju” čitave graphics engine jedinice. Cayman, tako, ima dva graphics engine-a, kao što se i vidi na dijagramu na prethodnoj strani. To takođe znači da novi GPU ima mogućnost da rasterizuje dva trougla po klok ciklusu, što znači da mora da ima dva odvojena logička bloka koja izvršavaju triangle setup, odnosno pripremu scene na nivou primitive. Osim toga, Caymanov dual-graphics engine ima mogućnost za rad na dva odvojena seta pripreme scene uključujući i backface culling (izbacivanje poligona koji neće biti vidljivi u krajnoj sceni (sećate se PowerVR Kyro kartica koje su, svojevremeno, u tome bile najbolje?), deljenje poligona (subdivision) i pripremu za tessellation. U ovom polju, ipak, AMD zaostaje za NVIDIA solucijom. GF110, primera radi, ima četiri “rasterizatora” koji obuhvata ukupno 16 PolyMorph engine-a.
U odnosu na Cypress, Cayman ima povećan broj SIMD “endžina” – za četiri, pa ih sada ima 24. Kako SIMD engine ima 16 SPU-ova, a svaki SPU (kod Cypress-a), pet ALU, shader jedinica, kalkulacijom: 20 x 16 x 5 dolazimo do brojke od čuvenih 1600 streaming processors jedinica. Cayman ima četiri ALU-a po SPU jedinici, pa računica izgleda nešto drugačije: 24 x 16 x 4 = 1536. Svaki SIMD engine ima po četiri TMU jedinice, 512KB L2 teksturne keš memorije i 64KB deljene bafer memorije. Dakle, na svaka 4 SPU-a i na svakih 16 ALU (shader) jedinica, ide jedan TMU, a ukupan broj teksturnih jedinica je 96, što je za 50% više u odnosu na Cypress (koji ih je imao 64). Ovo je, uz dual graphics engine jedan od najvećih “unapređenja” u odnosu na Radeon HD5800 seriju koji bi mogao da bitnije utiče na performanse u igrama.
Render back-end jedinica je ostala, praktično ista, kada je kvantitet u pitanju. I dalje može da obradi 32 piksela po kloku i 128 z-stencil informacija. Drugim rečima, ukupan broj ROP jedinica je i dalje 32. ROP je, ipak, dosta poboljšan za rad sa određenim tipom izlaznih podataka. INT16 operacije se izvršavaju dva puta brže, FP32 operacije se, tako, izvršavaju od dva do čak četiri puta brže.
Tessellator – 8. generacija
Shader Model u verziji 5.0 obuhvata High Level Shader Language (HLSL) koji pruža još dodatnih i novih načina za implementaciju shader programa. U odnosu na prethodnu verziju donosi podršku za double-precission, odnosno podršku za još duže i kompleksnije shadere. Hardverski tessellator je bio prisutan i u RV870 GPU-u, koji ATI razvija još od 2001. godine, a koji je u praksi najviše korišten unutar Xenos GPU-a kod Xbox 360 konzole, sada je podržan i od strane DirectX 11 API-ja. Dalje usložnjavanje objekata putem sub-division algoritama je moguće izvesti na više načina, ali su u DirectX 11 API-ju podržani Hull Shader i Domain Shader algoritmi. Jasno je da Tessellator samo može da učini da uglastiji objekat postane obliji, što će biti od pomoći na nekim objektima i terenima, ali ne može da kreira neke suptilne detalje na objektu, koje sam dizajner nije predvideo na njemu. Zato je za postizanje finih detalja na objektima i dalje neophodno koristiti displacement mape, kakve su bump teksture ili occlusion mape, koje se mogu koristiti i u sprezi sa transparentnim detailed mapama koje dodaju detalje na objektima sa baznom kolor teksturom bez potrebe da ista bude u ultra-visokoj rezoluciji.
Tessellator jedinica unutar Cayman GPU-a pripada osmoj generaciji. Novi tessellator omogućava off-chip bafering, što znači da se podaci o geometriji koju je kreirala sama jedinica mogu da se čuvaju u DRAM memoriji ako su on-chip keš memorije prepunjene.
Zbog čega je GF100 i GF110 efikasniji u tesselation operacijama od Cypress-a i Barts GPU-a? Najpre možemo da krenemo od rečenice iz prethodnog dela teksta u kome smo pomenuli da je tek sa Caymanom AMD napravio dual graphics engine koji pravi osnovne pripreme geometrije za dalju teselaciju. GF100 i GF110 imaju četiri ovakva “endžina” koji obuhvataju čak 16 PolyMorph jedinice. AMD je svestan činjenice da je tek sa Caymanom napravio GPU koji može da rasterizuje dva trougla po klok ciklusu, dok NVIDIA odavno može da rasterizuje četiri trougla po klok ciklusu. GPU kakav je Barts može da radi na jednom trouglu unutar jednog klok ciklusa, a da bi GPU mogao da obradi ogroman broj poligona, mora da bude i u stanju da paralelno izvršava rasterizaciju na više trouglova po klok ciklusu, najpre zato što će, kako sada stvari stoje, shader jedinica lako moći da “oboji i osenči” sve te poligone, jer je u odnosu na geometrijski deo čipa, u tom smislu prilično moćna.
U prethodnoj, sedmoj generaciji tessellator jedinice, AMD je uspeo da učini GPU znatno efikasnijim kada ista radi sa nižim faktorima za deljenje (situacije u kojima su performanse tessellator jedinice šeste generacije bile problem). Međutim, kod sedme generacije, AMD je upravo pričao o tome kako previše visok tessellation faktor dovodi do “overshadinga” tj. da svaki piksel u tim situacijama traži preterano veliki i redudantan broj shading prolaza. U AMD-u smatraju da brute force pristup ne vodi ničemu i da je bolje imati optimalne performanse pri dobro izbalansiranom načinu dizajniranja 3D scene. Dakle, problem sa šestom (Cypress), a donekle i sedmom generacijom tessellator jedinice (Barts) jesu performanse. Ipak, Barts je oko dva puta brži od Cypress-a kada se koriste faktori deljenja između 6 i 10 piksela po poligonu i oko 50% brži na nižim faktorima i onim koji su viši od 13-14 piksela po mesh-u (poligonu). Efikasnost tessellation jedinice i više radne učestanosti su još dva razloga zbog kog Barts, u modernim igrama, u kojima se intenzivno koristi tessellation na Radeon HD6870 kartici može da susitgne, a nekad i prestigne Cypress na Radeon HD5870 modelu. No, da bi osma generacija tessellation jedinice imala smisla, GPU mora biti sposoban da “provuče” više od jednog trougla po klok ciklusu, a Cayman to upravo i može. Kod Cypress-a, prilikom tessellation operacija, sama tessellation jedinica je bila usko grlo. A, da je osma generacija ove jedinice bila implementirana na Barts, graphics engine bi bio usko grlo. To je još jedan od razloga zbog kog Cayman ima dva graphics engine-a.
Kako je i tesselation jedinica poboljšana u odnosu na Cypress, a i sam GPU ima mogućnost za obradu dva trougla po klok ciklusu, Cayman može da, u određenom trenutku, barata sa tri puta većom količinom podataka o geometriji (u odnosu na Cypress). Ipak, zbog uštede prostora (i količine tranzistora), kod Caymana nisu povećane cache memorije u odnosu na prethodnika, pa je, kao što smo ranije naveli, omogućeno da se, po potrebi, geometry podaci snime u DRAM memoriju (koje, eto, ima sasvim dovoljno). Off-chip buffer je nužno zlo, jer je čak i najbrža GDDR5 memorija dosta sporija i ima mnogo veće latencije u odnosu na lokalne, on-chip, bafer memorije. Ipak, jasno je da je bolje da GPU ima off-chif buffer mogućnosti nego da performanse drastično opadnu u situacijama kada u 3D sceni ima mnogo baratanja sa sirovom geometrijom. Zbog svega navedenog, AMD tvrdi da su tesselation performanse Caymana negde od 1.5 do čak 3 puta veće u odnosu na Cypress.
Bolji antialiasing
MLAA
Osim poboljšanog anisotropic filtering algoritma, kod Barts i Cayman GPU-a, AMD je uveo i nov tip antialiasing-a. U ovoj oblasti, NVIDIA je tradicionalno bila bolja, bar kada su u pitanju „pametni“ oblici antialiasing-a, a ne „brute force“ varijante kakav je SuperSampling. NVIDIA CSAA (Coverage Sample Anti-Aliasing) u kombinaciji sa alpha-to-coverage jako lepo radi u igrama koje se dešavaju u prirodi (drveće, trava i lišće se obično predstavljaju alpha-teksturama). Klasični antialiasing algoritmi se izvršavaju tokom pripreme scene, bilo da se radi o MSAA ili SSAA metodama ili novijim Transparency, Temporal MSAA varijantama ili čak Custom Sample AA algoritmima. Svi ovi metodi moraju da imaju neku vrstu detekcije ivice ili alfa kanala unutar teksture, ali se sam AA primenjuje pred sam kraj pripreme scene.
Međutim, novi AMD-ov antialiasing algoritam je post-processing tipa. Naziva se Morphological Anti-aliasing (MLAA), radi u svim naslovima, bez obzira na API i primenjuje se na krajnju, 2D sliku. MLAA algoritam traži specifične vrste ivica na slikama, između kojih postoji velika razlika u kontrastu, a koji su udaljeni svega par piksela jedan od drugog. S obzirom na to da se primenjuje na običnoj 2D slici, MLAA je prilično nezahtevan metod, a ATI ga je već koristi na nekoliko generacija starom Xenos GPU-u unutar Xbox 360 konzole. Ovaj post-processing algoritam se obavlja u SP jedinicama, pa je moguće da će ga AMD „uključiti“ i kod Radeon HD5800 serije kartica.
Njegova prednost je što je nezahtevan i što će umekšati sve ivice. S druge strane, pošto radi sa 2D slikom, nije baš preterano „bistar“, pa će možda umekšati (zamutiti) i sliku tamo gde to nije potrebno, što dovodi do gubitka detalja. Ipak, sa njim možete eksperimentisati – pokazalo se da su SSAA i MSAA metodi često dosta zahtevni za igre kao što je Crysis (na Ultra podešavanjima), pa proverite da li će MLAA dati bolje rezultate u odnosu na situaciju kada nikakav AA nije primenjen. SuperSample Anti-Aliasing metod i dalje daje najbolji kvalitet prikaza – najstariji je i najkompatibilniji sa igrama, pogotovo ako se uključi i alpha-to-coverage, dok je MSAA negde između, a pruža jako dobre rezultate ako se aktivira adaptivni AA i transparency metod.
EQAA
Novi algoritam za umekšavanje ivica, popularni antialiasing – naziva se Enchanced Quality Antialiasing ili EQAA. Po svojoj funkcionalnosti je veoma sličan već pomenutom CSAA (coverage sampled antialiasing) metodu koji je NVIDIA predstavila uz G80 GPU. U to vreme, AMD je ponudio custom-filtered antialiasing (CFAA), o kome smo detaljno pisali tokom prvih DirectX 10 generacija Radeon i GeForce akceleratora (podsetićemo da su CFAA imali narrow i wide tent modove). Osim standardnih, MultiSampling i brute force SuperSampling metoda, AMD je imao i edge-detect metod CFAA antialiasing-a, a u poslednjoj generaciji je dodat i post-processing algoritam, koji radi umekšavanje na finalnoj, 2D slici (Morphological Antialiasing, MLAA). Od CFAA metoda se gotovo odustalo, baš kao i ranije od Temporal Antialiasing-a (TSAA). Svi ovi metodi antialiasinga (osim MLAA, koji i nije AA u pravom smislu reči) funkcionišu na bazi čuvanja kolornih informacija piksela koji se nalaze na ivici i to u render back-end delu GPU-a.
I anisotropic…
AMD je dodatno poradio na kvalitetu anizotropnog filtriranja, što nije bilo toliko komplikovano kao što izgleda, s obzirom na to da smo već pomenuli kako je ova specijalizovana jedinica sada izbačena iz GPU-a i dodeljena, kao programabilna funkcija, u sam compute-shader deo GPU-a (streaming jedinice). AMD tvrdi da je novi algoritam jednako dobar kao referentni, emulirani Direct3D rasterizer, ali, naravno, neuporedivo efikasniji, jer nije ništa sporiji u odnosu na rešenje iz prethodne generacije. U ovom trenutku, dakle, AMD poseduje rešenje koje je bolje od konkurentskog, čak i kada se u ForceWare drajverima primeni high quality filtering. Čak i za običan trilinear filtering mod, AMD sada primenjuje full -true trilinear bez primene blendinga koji je uvek bio uključen, kako bi se aproksimacija prethodnih, manje preciznih (tzv. adaptive trilinear) metoda, koje su se koristile radi boljih performansi, manje videla u igrama. Kako se sada ova operacija obavlja unutar shader jedinica, AMD je odlučio da poveća kvalitet prikaza i na tome im skidamo kapu. Zadržavanje adaptive trilinear metoda bi možda dodatno povećalo performanse (i dalje ga je moguće aktivirati u drajverima), ali je podrazumevano (default) podešavanje – full trilinear. Sve ove funkcije su postojale i kod Evergreen generacije GPU-ova, ali AMD je napravio dodatna poboljšanja kada je u pitanju anizotropno filtriranje tekstura.
Kod Cypress GPU-a smo prvi put videli anizotropno filtriranje koje je potpuno nezavisno od ugla pod kojim se prikazuje neka površina (tekstura) – nešto sa čim je Radeon HD4000 i serije pre nje, imala poteškoća. Međutim, i novi AF algoritam, koliko god delovao savršeno, imao je poteškoća sa velikim ravnim površinama i teksturama koje imaju čest, sitan patern ponavljanja (metalne površine sa pravilnim urezima i sl.). U tom slučaju se jasno vidi razlika između dve mip-mape tj. iste teksture različitih mip nivoa (čuveni krugovi oko “igrača”). Taj problem nije do kraja rešen i vidljiv je na specifičnim teksturama koje se obično javljaju u trkačkim igrama ili u naučno-fantastičnim FPS naslovima. Kao što smo imali prilike da vidimo i u Los Anđelesu i ovaj problem je rešen od Barts GPU-a, a prirodno, važi i za Cayman GPU.
Osim algoritama koji su i ranije bili prisutni, sada je tu i block texture compression mod koji je AMD osmislio i predložio da bude uključen u DirectX 11 specifikaciju. Ovaj algoritam podrazumeva efikasniju kompresiju, brži rad i viši kvalitet nakon rekompresije u odnosu na prethodna rešenja (bolji rad sa alfa-kanalima, transparentnim i FP16 HDR slikama, bolji signal-to-noise odnos, itd.), pa je sada moguća kompresija i u odnosu od 6 : 1 i to za teksture koje su prilično velike (čak 16.000 x 16.000 piksela).
PowerTune
PowerTune je tehnologija koju poznajemo od ranije – zaslužna za izuzetno nisku potrošnju Evergreen familije kartica u idle režimu rada. Nova verzija ove tehnologije dodatno optimizuje potrošnju, ali ne samo u idle režimu, već bi to trebalo da čini i kada je kartica pod opterećenjem. Naime, radi se o mehanizmu koji sprečava da kartica, tj. GPU “povuku” više struje nego što im je zacrtano tokom maksimalnog TDP (total dissipation power) opterećenja u “normalnim” situacijama. Ovo će sprečiti da aplikacije poput FurMark-a, koji umeju GPU da opterete i preko 100% (znamo da je to, matematički nemoguće, ali nemamo bolji način da opišemo ono što FurMark radi grafičkom čipu i čitavom akceleratoru, zbog čega ga nikad nismo ni koristili tokom testiranja). NVIDIA je ovakav mehanizam uvela kod GeForce GTX 580 i GTX 570 akceleratora, ali je AMD korisnicima omogućio da taj feature i detaljnije kontrolišu putem (novih) drajvera. Kao što ćemo videti prilikom opisa samih kartica, Cayman akceleratori poseduju novi mikroprocesor koji nadgleda trenutnu potrošnju GPU-a i memorije i stara se da ukupna potrošnja ne preskoči propisanu vrednost za taj model. Ali, dok je ovo možda dobra stvar za sam AMD i njihov PR koji će prezentovati Green Peace-u, igračima i testerima može samo da zada glavobolju. Jer, PowerTune će, pri većem opterećenju oboriti radne frekvencije čipa, ako TDP premaši određenu, propisanu granicu. Ali, ova granica neće biti premašena samo u FurMark testu – PowerTune će oboriti “klokove” i u izuzetno zahtevnim igrama, kada je uključen AA i AF.
AMD je ovu opciju uveo iz istog razloga kao i NVIDIA, ali ju je daleko bolje dokumentovao i dao korisnicima slobodu da je pojačaju ili ublaže. Pod “Overdrive” tabom u Catalyst drajverima je moguće “dati” grafičkom čipu do 20% ekstra “prostora”, te će moći da povuče i za petinu više struje nego što je to propisano. Ako, pak, želite da uštedite na računu za struju, možete i smanjiti TDP za do 20%, pa će PowerTune mnogo češće i žešće da obara radne frekvencije vašeg akceleratora. U igrama koje nisu zahtevne, korisnici ovo mogu da učine kako bi kartica radila hladnije i tiše (ako je već razlika u potrošnji, čak i na godišnjem nivou – zanemarljiva).
Razlog koji smo pomenuli na početku prethodnog pasusa je sledeći. Postoje određeni testovi, koji, slično PRIME95 testu za opterećenje sistemskog procesora, “prže” GPU i čine da isti vuče mnogo više struje nego što bi to činio i tokom najzahtevnije igre. Ovakve aplikacije (FurMark ili 3DMark Perlin Noise test) će činiti da GPU vuče previše, a ako ne bi postojao sistem koji štiti sam akcelerator i GPU, moglo bi da dođe i do oštećenja hardvera. Takođe, slične aplikacije su činile da se proizvođači grafičkih kartica u prošlosti drže konzervativnijih fabričkih vrednosti za svoje kartice, što sada neće biti slučaj. GPU i memorija će u budućnosti biti setovani agresivnije, a ako je poenta da se kartica sintetički “prži”, sistem će je zaštiti od ovakvog načina “zloupotrebe”.
Tokom overklokovanja i testiranja, mi smo, naravno, postavili PowerTune na +20%. Korisno je znati da korisnik na ovakav način može dodatno da se zaštiti. Ako overklokuje karticu za 10%, može i PowerTune da “pojača” za istu vrednost, kako bi bio siguran da GPU ne radi pod preteranim opterećenjem i da, ako išta krene loše da se dešava, postoji sistem koji će sprečiti da bilo šta pođe kako ne treba. Takođe, u nižim klasama kartica i u zatvorenom kućištu manjih gabarita (recimo u nekom Home Theater PC računaru) korisnik može da “utiša” karticu i tako što će smanjiti PowerTune i postaviti ga na -20%. Kartica će i dalje biti dovoljno brza za akceleraciju video materijala, ali će 20% niži TDP učiniti da ventilator retko kad radi brže od najsporijeg “režima”, što će rezultovati i tišim radom. Pošto je maksimalni TDP za Radeon HD6970 – 250W, uz +20% dodat kroz Catalyst PowerTune, stižemo do maksimalnih 300W koliko bi kartica smela da “povuče”, što je, po našem mišljenju, sasvim dovoljno. Naravno, ovde će biti oštećeni hardcore overklokeri, koji kartice hlade tečnim azotom i kojima će, verovatno, biti potrebno i više od 350W za ovakvu karticu, u pojedinim slučajevima. Ovi korisnici će, verujemo, moći da se snađu i zaobiću PowerTune pomoću nekih specijalnih alata, tweak-ova ili modifikacije drajvera.
AMD EyeSpeed i EyeFinity
Jedna od zanimljivih novina je i novi Catalyst A.I. slajder koji omogućava da se dodatno podesi nivo optimzacije u radu sa teksturama. Sada se pod Texture Filtering Quality opcijom pod Catalyst A.I. nalaze tri opcije – High Quality, Quality (podrazumevana) i Performance. High Quality praktično isključuje Catalyst A.I., dok Quality uključuje dve opcije koje su se ranije nalazile pod posebnim „tabom“, do kog se teško dolazilo (enable trilinear optimization i anisotropic sample optimization). Takođe, Teri Makedon je pomenuo da je sada svaki sRGB prikaz uz pomoć Radeon HD6000 serije kartica propisno kolorno kalibrisan, što će dosta značiti vlasnicima Wide Color Gamut LCD / TFT ekrana. AMD je dva dana pre predstavljanja Radeon HD6900 kartica prezentovao i novu generaciju Catalyst drajvera, čiji detaljan opis možete pogledati na ovoj adresi.
AMD EyeFinity
Kontroler koji omogućava prikaz slike na ekranu je potpuno redizajniran da se može reći da je ponovo kreiran – od nule. Naime, on sada podržava sve tipove video konekcija, od D-Sub-a, preko DVI-I i HDMI konekcije, pa sve do Display Porta u verziji 1.2. Osim toga, novi display controller nudi mogućnost prikaza do čak šest video stream-ova uz preciznost od 10-bita po komponenti (boji). Ovaj programabilni deo GPU-a je tako i u mogućnosti da prikaže jedan “ekran” u fantastičnoj rezoluciji od 5760 x 2160 piksela. Štaviše, u ovoj rezoluciji se možete i igrati!
Na prvih nekoliko strana smo pominjali i mogućnost da Radeon HD5870 akcelerator prikaže sliku na čak šest monitora. Svakako, za tako nešto vam je potrebno specijalno izdanje koje se naziva Radeon HD5870 Eyefinity6 Edition. Danas je to moguće učiniti sa samo jednom karticom, uz pomoć dodatnih adaptera, ali čak i bez njih možete da sastavite tri ekrana i radite u fantastičnih 5760 x 1080 piksela. Sa dve kartice, ako se upotrebi svih šest displeja, maksimalna rezolucija za svaki od njih se spušta na 1920 x 1080 piksela, što ukupno daje mod od 5760 x 2160 piksela! I da, u ovoj rezoluciji možete igrati Crysis, Flight Simulator, Dirt 2, Need For Speed ili skoro bilo koju aktuelnu igru koja vam padne na pamet. Naravno, za solidne performanse u tako monstruoznim grafičkim modovima će biti neophodno i da dodatno osnažite grafički podsistem sa još jednom, dve ili tri Radeon HD6870 kartice, ali ako baš imate viška para, prostora i sebe smatrate ultimativnim igračem, dobro je znati da je i ovako nešto moguće. Štaviše, u CrossFire X varijantama je moguće povezati čak i 24 monitora, što će se retko viđati i na sajmovima, ali je sjajna demonstracija sile! Uostalom, za igranje u 5760 x 2160 piksela, mogli biste da sačekate mesec dana i pazarite dve Radeon HD6970 kartice. Ili dva DualGPU Radeon HD6990 modela!
Kod Northern Islands serije GPU-ova, AMD je modernizovao i tipove video-out konekcija. Radeon HD6800 kartice podržavaju i stižu sa HDMI 1.4a portom, koji podržava Blu-ray 3D. Tu je i podrška za novi DisplayPort u verziji 1.2, koji takođe podržava 3D. DisplayPort 1.2 zapravo ima dovoljno veliki bandwidth da prikaže sliku na čak četiri FullHD ekrana u 1080p rezoluciji (za to je, ipak, neopdodan Multi-Stream-Transport hab (MST hab)) ili čak dva ekrana u rezoluciji 2560 x 1440 piksela, što je korisno znati ako imate dva 30-inčna monitora. Dva DVI konektora na kartici nisu ista, pa jedan daje maksimalnu rezoluciju od 2560 x 1600 piksela (Dual-Link DVI), a drugi 1920 x 1440 piksela (Single-Link DVI).
DisplayPort 1.2 ima značajan broj prednosti u odnosu na DL-DVI, pa čak i HDMI 1.4, a to su:
znatno viši propusni opseg (DisplayPort 1.2 ima dva puta veći bandwidth od verzije 1.1 i podržava istovremeni protok različitih display tajminga i rezolucija, ali i osvežavanja i dubine boja)
DisplayPort 1.2 je neophodan za prikaz Ultra-HD rezolucija (Radeon HD6800 kartice mogu da prikažu sliku na jednom ekranu, putem jednog DP priključka čak i u rezoluciji 4096 x 2160 piksela pri osvežavanju od 50 Hz)
za razliku od HDMI i DVI standarda, DisplayPort omogućava povezivanje uređaja putem jako dugačkih, pasivnih kablova
podržava prenos audio signala, za razliku od DVI konektora
podržava prenos različitih tipova signala i originalnog TMDS signala sa karakteristikama koje su pogodne za DVI ili HDMI, pa je zato jako lako i jeftino napraviti DP-DVI ili DP-HDMI adaptere
HDMI je pogodan za prenos 3D stereoskopskih slika u rezoluciji od 1920 x 1080 piksela pri 30 fps, ali je za veći frejmrejt potrebno ići na DisplayPort 1.2
DisplayPort 1.2 ima propusnu moć od 17 Gbit/s, što je dovoljno za prikaz slike na četiri 1080P ekrana pri osvežavanju od 60 Hz ili dva 2560 x 1600 displeja pri istom 60 Hz osvežavanju, odnosno 3D sliku na 2560 x 1600 piksela uz osvežavanje od 120 Hz.
Unified Video Decoder (Engine) 3.0
Prva generacija AMD Unified Video Decoding engine-a je već bila dovoljno usavršena i o njoj smo više puta pisali. NVIDIA grafičkih procesori od G84 na ovamo, kao i nova familija Radeon HD2000 (bez 2900XT i Pro modela) i HD3000 akceleratora imaju posvećeni video processing engine koji ATI naziva Unified Video Decoder. U odnosu na AVIVO, UVD je napredovao koliko i PureVideo HD druge generacije u odnosu na rešenje iz GeForce 7 familije, a nakon njegovog izostanka ili nefunkcionalnosti kod R600 kartica, našao je svoje mesto kod aktuelne HD3800 serije. AMD tvrdi da je smanjenje CPU utilizacije pri posmatranju H.264, a posebno VC-1 video formata, koji su postali standardni video kodeci za BluRay naslove zaista vredno pažnje, čak i na desktop sistemima. Prilikom obrade HD video signala, pred grafičkom karticom stoji izazov koji se ne završava samo na procesiranju bar 6x više informacija u odnosu na video signal standardne definicije. Jednostavno rečeno, grafičke kartice poseduju specijalnu logiku koja im objašnjava kako da brojne shader jedinice iskoriste za obradu video signala. Pošto su GPU-ovi sve moćniji, zbog čega stati na 1080p rezoluciji? AMD je proširio podršku i za XHD rezolucije, što nam nije teško da zamislimo jer, ako ove kartice bez problema rade sa stotinama tekstura visoke rezolucije koje “lepe” na hiljade poligona u 3D igrama, zbog čega ne bi mogle da, tridesetak puta u sekundi, nalepe jednu “teksturu” na jednu površinu na ekranu. Naravno, jasno je da se na tu “teksturu” primenjuju malo zahtevniji algoritmi od običnog trilinear ili anisotropic filtera, brinuti o daljem toku podataka, korekciji i kompenzaciji pokreta, de-interlacing-u, 3:2 ili 5:5 pulldown-u (RealCinema 24p) i tome slično, ali je sve to, složićete se, i dalje manje kompleksan “shader program” od “sličnih” rutina u modernim igrama.
Početne BitStream i Entropy Decode faze se sada izvršavaju od strane GPU-a. UVD je kreiran da u potpunosti dekodira i najzahtevnije (i najnaprednije) video kodeke kakvi su VC-1 i H.264, uključujući i bitrate od 40 Mbps ili više i koristi već postojeća, programabilna SIMD jezgra, odnosno Stream Processors jedinice. Ono što Radeon GPU-ovi podržavaju još od prve generacije UVD „endžina“ , a od nedavno i konkurencija sa novim GPU-ovima, naziva se full-speed CABAC i CAVLC dekodiranje u okviru H.264 i VC-1 kodeka. Sav postprocessing se obavlja unutar shader jedinica, uz primenu filtera koji su ništa drugo do namenski kreirani shader programi koji se u potpunosti izvršavaju in hardware. HDMI, odnosno High Definition Multimedia Interface je u potpunosti podržan od strane RV670 i novijih AMD GPU-a, zajedno sa obaveznim HDCP (High-bandwidth Digital Copy Protection) sistemom zaštite od kopiranja. Osim digitalnog signala, HDMI konektor “prenosi” i više kanalni audio zvuk, koji RV770, kao i RV790 i RV870 podržavaju. Novina kod Cypress GPU-a bila je hardverski upscale 1080p filmova u rezoluciju 2650 x 1600 piksela, što zaista izgleda impresivno. Novine UVD 2.0 endžina su bile:
Hardware acceleration dekoding za dva 1080P HD stream-a
Kompatibilnost sa Windows Aero modom – reprodukcija HD video klipova uz aktivan Aero Glass mod na desktopu
Video gamma – gamma kontrola je nezavisna od iste koja važi za Windows desktop
Brighter whites – Blue Stretch procesiranje povećava vrednost svetlijih tonova za dinamičniji prikaz videa
Dynamic Video Range – bolja dinamička kontrola tamnih tonova i crne tokom reprodukcije
Dodate su i funkcije Dynamic Contrast Enchancement i Dynamic Color Enchancement za koje već iz samog naziva možete da predpostavite koju ulogu imaju. Kod prethodne generacije UVD-a smo imali podršku za maksimalno 5.1, 16-bit PCM Stereo ili kompresovani AC3 5.1 više kanalni audio-stream po Dolby Digital i Dolby DTS standardima, ali je to kod RV770 i novijih čipova sve dovedeno na viši nivo – sada je podržan osmokanalni (7.1) audio uz maksimalan bitrate od 6.144 Mbps i sempling od 192KHz i 24-bita. Podrška za “filmske” formate se ne zaustavlja na Dolby DTS i Digital standardima – tu su sada i True-HD i DTS HD formati u koje se slažu zvučne slike na novim BluRay izdanjima. Još jedna od bitnih novina je i mogućnost dual-stream plejebeka, pa Cypress može da pusti dva HD video feed-a i to u modu “slika-u-slici” sa kompletnim de-kodiranjem kroz VC-1, H.264 i MPEG-2 (uz upscaling DVD formata u HD rezolucije i nove profile sa dinamičkim kontrastom).
Treća generacija Unified Video Decoder “endžina” donosi vrlo bitne novine. Među najbitnije dve je hardverska akceleracija 3D Blu-ray video kodeka (MVC), kao i MPEG-2 dekoding, koji se sada u potpunosti obavlja unutar GPU-a. MPEG 4 Part 2, poznatiji kao DivX, sada se takođe dekodira hardverski, unutar GPU-a.
AMD Accelerated Parallel Processing (APP)
Takođe ćemo pomenuti da je AMD preimenovao ATI Stream u AMD Accelerated Parallel Processing (APP), koji se oslanja na OpenCL kao standard za taskove koji podrazumevaju veliku paralelizaciju u radu (obrada i rendering video materijala npr.). I dok NVIDIA za svoj zatvoreni CUDA sistem ima poseban sajt (CUDA Zone), AMD je kao podršku za otvoreni standard kreirao sajt OpenCL Zone. AMD, naravno, podržava i jedan od standarda koji nije jednako otvorenog koncepta, ali je deo „nezaustavljive“ mašinerije zvane Microsoft DirectX 11 – naravno, radi se o DirectCompute 11 standardu. Naravno, APP nije stvar koja je rezervisana samo za grafičke kartice, jer će se OpenCL i drugi otvoreni API-ji i razvojna okruženja izvršavati i na x86 procesoru kakav je AMD Fusion. Zapravo, GPU deo Fusiona će se oslanjati na OpenCL i DirectCompute 11, a CPU na x86 instrukcije. APP SDK u verziji 2.2 se može preuzeti sa AMD-ovog sajta.
Open Stereo 3D inicijativa
Ako imate neki od vertikalno polarizovanih LCDTV uređaja i pasivne, odgovarajuće naočare sa polarizovanim staklima, zašto da ne iskoristite ovaj sistem? U svakom slučaju, između vašeg 3D iskustva sa jedne i aplikacije (igre) i drajvera sa druge strane, stoji posebna vrsta softvera (tzv. middleware), koji od 3D igara kreira prave, stereoskopske – 3D igre. Kompanije kao što su DDD ili iZ3D već imaju gotova rešenja koja su demonstrirana upravo na launchu Radeon HD6800 karticau Los Anđelesu. Mi smo imali prilike da igramo igre Deus Ex 3 i Medal of Honor uz pomoć aktivnih, odnsono pasivno polarizovanih Oakley 3D naočara i bili smo gotovo fascinirani onim što smo videli. Rešenje svakako nije lošije od NVIDIA 3D Vision-a, ako u nekim momentima nije i bolje. I, posle nekog vremena ne dolazi do zamora u očima. Softver, koji je zapravo driver wrapper, iz kompanija DDD i iZ3D već sada ima preko 400 profila za aktuelne 3D igre. I što je zanimljivo, ovaj softver radi i sa NVIDIA grafičkim karticama, pa ako se odlučite za GeForce, a ne sviđa vam se njihov 3D Vision sistem, znajte da postoji izbor.
Ovim smo došli do kraja predstavljanja tehnologije vezane za Cayman GPU i Radeon HD6900 seriju grafičkih kartica. U tekstu koji sledi, predstavićemo referentne Radeon HD6950 i HD6970 akceleratore, a onda i njihove performanse u čak 22 aktuelne igre i benchmark programe u kojima ih poredimo sa direktnim konkurentima i prethodnicima iz sopstvene kategorije.
Peformanse kartica i zaključak očekujte nakon pauze!