AMD Radeon HD6850 i HD6870 (1/2)

AMD Radeon HD6850 i HD6870 (1/2)

DirectX 11, GDDR5 i 40-nanometarska litografija su i dalje aktuelni standardi. Ipak, AMD je predstavio novu generaciju video akceleratora koja se i ovoga puta oslanja na postojeće “standarde”. Dalja optimizacija Cypress / Evergreen tehnologije, u vidu Northern Islands generacije čipova, među kojima je prvi na redu Barts GPU, na pravi način pokazuje da nekad manje zaista može da znači – više. U sve to nas je uverila sama kompanija AMD, koj

    Sadržaj

       

      Branko Maksimović

      AMD Radeon HD6850 i HD6870

      Zahvaljujući kompaniji AMD, potpisnik redova ispisanih na ovoj i narednim stranama, video je i prošao kroz solidan broj egzotičnih lokacija: ATI i Canyon su nas vodili na Kipar u vreme kada su bile aktuelne Radeon X850 kartice, a kada se spekulisalo u “Fudo” GPU-u i kada je Kris Huk i dalje bio party-animal. Zatim, vodili su nas na Ibizu, kada je predstavljan prvi Shader Model 3.0 GPU – Radeon X1800 serija, a potom su glavnom i odgovornom uredniku Benchmarka omogućili da vidi kako se i gde prave Ferrari automobili. Bivši hardverski urednik sajta je, zatim, išao sa ATI/AMD-om na letovanje u Tunis, a gore potpisani je narednu, pravoslavnu Novu Godinu proveo u prelepoj Moskvi sa još lepšim Ruskinjama. No, izgleda da je ultimativni momenat i jagoda na vrhu ove prelepe torte ipak launch prvog GPU-a iz nove, Northern Islands familije grafičkih čipova (i najava za sledeći, koji stiže za mesec dana), a koja je tu da zameni Evergreen familiju. Iako smo u dolasku u Los Anđeles, preletali preko „severnih ostrva“ , zaliva i jezera koje su lednici pre više miliona godina napravili u Severnoj Kanadi, ostatak našeg boravka u Kaliforniji, pamtićemo po toplom vremenu i toploj dobrodošlici koju su nam, kao i mnogo puta do sada, priredili kolege i prijatelji iz kompanije AMD.
       

      Los Anđeles je drugi po redu najveći grad u Sjedinjenim Državama i svakako najveći po površini. Osim u centru grada, gde se iz ravnice diže nekoliko većih nebodera, čitav „El ej“ je uglavnom sastavljen od kuća kakve viđamo u američkim predgrađima. Pošto, sa svim okruzima broji preko 12 miliona stanovnika, onda vas neće iznenaditi to što je njegova površina veća od površine čitave Vojvodine. Iz istog razloga će vam svaki lokalac reći da je bez automobila jako nezahvalno putovati kroz grad – ako želite da iz strogog centra grada odete, recimo do Santa Monike, prema severo-zapadu, spremite se da pređete razdaljinu sličnu onoj između Beograda i Novog Sada. Ako biste putovali iz Pasadene, koja je istočno od centra, put bi bio dva puta duži. Saobraćaj funkcioniše besprekorno, bilo da se radi o metrou ili autobuskim linijama, a ništa vam nije potrebno za planiranje bilo koje rute, osim Google Maps-a. Jedini problem je što se gradske linije obično kreću pravcima istok-zapad i sever-jug i što je sve jako, jako udaljeno, pa je za kretanje „po dijagonali“ potrebno dosta presedanja. Ipak, u odnosu na naš javni prevoz, ozloglašene Metro linije (bus i „subway“) i u gigantskom gradu kakav je Los Anđeles – funkcionišu perfektno.
       

      AMD je više od 100 novinara iz celog sveta (samo dvojica iz „Adriatic“ regije) smestio u zapadni Holivud, čuveni Century City, koji je poznat po visokim zgradama, kancelarijama mnogih holivudskih produkcijskih i agencijskih kuća, ali i banaka i osiguravajućih društava. Hyatt Regency lanac hotela nije potrebno posebno predstavljati, pa ćemo odmah da „skočimo“ na sutrašnji dan, koji još uvek nije bio „radni“, jer je veliki deo novinara tek trebalo da pristigne. Oni koji su imali sreće da dođu na vreme, imali su fenomenalan dan u Universal Studiju, najvećoj televizijskoj i filmskoj kući koja postoji gotovo čitavih stotinu godina! Ovaj studio je od sledećeg najvećeg veći čak četiri puta – 4000 hektara površine zauzimaju svih 40-ak ogromnih filmskih studija, dok su otvoreni setovi nešto zaista fascinantno. Opis čitavog doživljaja i svega što smo videli u „Universalu“ kao VIP posetioci (koji ne čekaju na redove, voze se specijalnim autobusom i idu na sve vožnje, plus besplatan ručak) od strane nekog ko je velik filmofil i verbalno traje preko sat vremena, a da se strahovi kolege Saše Marinkovića ne bi obistinili, priču o Universalu, vožnji između kuća poznatih na Beverli Hilsu i ostalim lepim stvarima koje su se desile, prekinućemo već ovde… 🙂

      AMD Fusion, trendovi i strategije

      Postoji još jedan razlog zbog kog je AMD odlučio da Northern Islands predstavi baš u Holivudu. Svečana manifestacija održana je u strogom centru grada, u otmenom klubu sa bogatom istorijom, Exchange LA, osnovanim još 1929. godine. U centralnom delu, čak tri ogromna platna postavljena su u nekakvu vrstu gigantskog EyeFinity-ja, koji je sistem prezentacije koristio na najbolji mogući način. Centralni deo ekrana je bio zadužen za glavna dešavanja, a propratne informacije su se prikazivale levo i desno. Na balkonima su bile postavljene demo jedinice partnera kompanije AMD, pa smo tamo mogli da vidimo brojne sisteme za igranje i gledanje filmova u 3D-u, računar sa igrama Deus Ex 3 i tek predstavljeni Medal of Honor i veliki broj praktičnih primena za stream computing sa AMD-ovim novim Accelerated Parallel Processing sistemom (bivši ATI Stream, više o tome kasnije).
       

      Naravno, zvezda večeri je bila AMD Radeon HD6800 serija kartica, odnosno Barts GPU, a odmah nakon uvodne reči g. Rika Bergmana (Senior Vice President & General Manager u AMD-u), na binu je došao gospodin koji živi i radi u Holivudu i koji je „desna ruka“ čuvenog režisera Roberta Rodrigeza, čiji hit „Mačeta“ trenutno igra u domaćim bioskopima. Gospodin Rodni Brunet, zaposlen u kompaniji Troublemaker Studios, pričao je o tome kako je AMD-ova tehnologija upotrebljena da se brzo i jeftino naprave filmovi kao što su Predators ili Machete. Umesto screenboard-a, korišteni su desktop i server računari sa AMD Phenom procesorima i Radeon HD5800 grafikom za naprednu pre-vizuelizaciju scena, uključujući tu i simulacije fizike. Uz ovakvu upotrebu hardvera i GPU akceleracije, pre-vis, pa čak i post-processing obrada nekih CG scena, obavlja se „na živo“ na sasvim „običnom“ Phenom/Radeon hardveru kakve mnogi od nas imaju u svojim kućama. Uz primenu ovakve tehnologije, g. Rodrigez je uspeo da snimi “Mačetu” za svega 30 miliona dolara, kao i da ubrza proces snimanja filmova na čak dva godišnje. Robert Rodrigez je poznat i po dečijim filmovima Spy Kids (serijal, 4 filma), ali i čuvenim delima kao što su “Od Sumraka Do Svitanja”, “Četiri Sobe”, “Desperado” i “Grad Greha”. Ostatak predavanja je, ipak, u fokusu imao novine koje donosi Northern Islands, pa ćemo i mi početi da pričamo našu priču o Barts grafičkom čipu. Krenimo redom…

      Barts: Sweet Spot po četvrti put

      Radeon HD5000 familija video i grafičkih kartica je i definitivno bila najuspešnija koju ATI (sada AMD) pamti od kako se bavi dizajniranjem grafičkih čipova. Sa gotovo 18 meseci prednosti kada je u pitanju podrška za DirectX 11 i čak dve godine prednosti u upotrebi GDDR5 memorije, može se reći da je AMD uživao kao “kralj na tronu” i kada je tehnologija, ali i kada su performanse u pitanju. Iako su svi smatrali da će se, nakon Cypress-a, čipa koji je “pogonio” Radeon HD5800 seriju, Radeon HD6800 pokretati nešto mnogo jače, AMD se odlučio da napravi malo drugačiji korak, koji isprva neće delovati tako, ali koji svakako jeste dobar i za krajnje kupce, ali i za tržište i samu kompaniju. Naslednik Cypress-a je, na neki način već sada pred nama, dok neki tvrde da će “pravi naslednik” tek doći kada stigne Cayman, GPU koji će pogoniti Radeon HD6900 seriju kartica. No, idemo jedan korak u nazad.
       

      GPU

      Barts GPU je takođe kreiran da podrži DirectX 11 i sve tehnologije koje već podržava i Cypress, a pošto je još uvek aktuelna 40nm litografija, jasno je da, u ovom cenovnom rangu ne može da se napravi ništa što bi moglo da košta isto ili manje, a da ponudi veće performanse. Ipak, optimizacija arhitekture i uz postojeća ograničenja koje nameće razvoj litografije tj. usitnjavanja procesa je i dalje moguća i AMD je to demonstrirao sa Barts-om, na najbolji mogući način. Pre nego što smo zavirili u tzv. “deep dive” priču o tehnologiji i arhitekturi, prikazano nam je da Radeon HD6800 serija podrazumeva dva modela. Radeon HD6870, jači model, radi na 900 MHz, ima 32 ROP-a i 1120 stream processing jedinice. Memorija je podešena na efektivnih 4200 MHz, a maksimalna potrošnja je fantastičnih 151W, odnosno svega 19W u stanju “mirovanja”.
       

      AMD nije krio da se radi o daljem razvoju postojeće Cypress tehnologije, ali nas je, u ovom trenutku, još uvek bunilo to što Radeon HD6870 ima 480 SP jedinica manje od Radeona HD5870. Radeon HD6850 ima još manje aktivnih jedinica – 960 SP-a i radni takt od 750 MHz, uz VRAM koji radi na 4.0 GHz. Kao što smo rekli, Barts GPU je blago unapređenje Cypress-a, što znači da su shader jedinice i dalje 5-way tipa – VLIW5, dok Cayman koristi jednostavniji VLIW4, ali će zato verovatno njihov broj biti znatno veći. Organizacija keš memorija, deljenih struktura, render back-end jedinice i memorijskog kontrolera je gotovo jednaka onoj kod Cypress-a, iako AMD ističe da su neke od njih blago unapređene, s izuzetkom i akcentom na jedinici za tesselation, koja je znatno redizajnirana. O nekim stvarima o kojima AMD nije pričao na “deep dive” prezentaciji, a koji su nam bili nejasni, pitali smo g. Erika Demersa, koga smo upoznali još na Ibizi, pa je tako broj informacija koje ćete naći u našem testu Radeon HD6800 serije kartica možda nešto veći u odnosu na ono što će napisati kolege.
       


      Cypress jezgro

      Kao što možete videti na dijagramima, Barts je znatno manji GPU od Cypress-a. Oba su izrađena u TSMC-ovim pogonima u 40-nm postupku i dok Cypress ima 2.13, Barts ima 1.7 milijardi tranzistora. Tako je i površina čipa smanjena sa 334 na 255 kvadratnih milimetara. Naravno, najveća ušteda je postignuta kroz smanjenje broja SIMD jedinica, tj. klastera. Barts je zamišljen kao jeftin GPU, ali kao GPU koji tačno “gađa” u centar Sweet Spot mete i koji se nalazi na savršenoj međi između fantastičnih performansi sa jedne i popularne cene sa druge strane. Radeon HD6800 familija kartica nije tu da nasledi HD5800 seriju u “performance” smislu, već u “tržišnom” smislu. Nove kartice su bolje za kupca, jer su jeftinije, AMD na njima ima veći profit, a samim tim što su povoljnije, omogućiće visoke performanse i korisnicima koji ne žele da za 3D i video akcelerator izdvoje više od 200 evra. Sve ovo što smo nabrojali nikako nije bilo moguće sa Cypress-om, koji jeste, u svoje vreme, bio sjajan čip, ali ga je po pitanju optimizacije i isplativosti, Barts poprilično nadmašio. Idealno za AMD bi bilo da je TSMC uspeo da finalizuje i ispolira 32nm proces, za koji su yield-ovi i dalje isuviše mali (podatak je dobijen iz simulacija, pošto tape-out Barts-a u 32nm nije rađen). Koliko smo sada uspeli da saznamo, TSMC će preskočiti 32nm proces i ići direktno na 28nm, koji će biti spreman do kraja naredne godine. U to vreme bi, već, trebalo da imamo Radeon akceleratore koji koštaju 100-ak evra i nude performanse slične onima koje u ovom trenutku nudi Radeon HD6850.
       


      Barts jezgro

      Pogledajmo pojednostavljeni grafički prikaz čipa. Dakle, Cypress je imao 20 SIMD blokova, a u svakom se vidi po 16 thread processors unit-a i unutar svakog od nih pet aritmetičkih jedinica. Po AMD-ovom kalkulatoru, 20 x 16 x 5 = 1600, pa je tako navedeno da Cypress ima 1600 streaming processors jedinica. NVIDIA bi možda ovo objasnila drugačije – GPU ima 320 shader jedinica, ali je svaka od njih 5-way. U svakom slučaju, i dalje se radi o ALU jedinicama koje rade sa skalarnim operacijama, uz poseban translator koji vektorske instrukcije prevodi u nedimenzionalne, skalarne. Barts ima 14 SIMD blokova, pa je kalkulacija drugačija – 14 x 16 x 5 = 1120.
       

      Organizacija SIMD (Single Instruction Multiple Data) jedinica je, zapravo, jako slična organizaciji kod prethodnih generacija i u biti se nije promenila još od Radeona HD2900. Unutar svakog SIMD bloka postoji primarna izvršna jedinica superskalarnog tipa koja poseduje pet aritmetičko logičkih podjedinica (ALU-ova) sposobnih za po jednu MAD (multiply-add) instrukciju po ciklusu u 32-bitnom FP formatu. Od tih pet jedinica, jedna je zadužena i za transcendentne matematičke operacije (sin, cos, log, exp). Izvršne jedinice su povezane sa drugim takvim jedinicama unutar susednih SIMD-ova (uz osam obaveznih ciklusa kašnjenja, koji su „prepleteni“ pa je efektivna latencija svega četiri ciklusa). Ovde se ne misli na kašnjenje informacija koje SIMD-ovi dele, već o toku izvršavanja thread(ova) kroz streaming / shader deo GPU-a. Ako četiri ciklusa „latencije“ pomnožimo sa ALU „širinom“ svakog SIMD-a, dobićemo cifru od 64, što je upravo cifra o kojoj smo pričali kada smo objašnjavali arhitekturu Radeon HD2900XT akceleratora i koliko je bitno što je branching sada moguće podeliti na 64 piksela ili delova thread-a radi veće preciznosti i višeg „kvaliteta“ output-a.
       

      Drugim rečima, SIMD jedinica je kontrolisana putem VLIW (very long instruction word) komande, koja može da obuhvati šest instukcija – pet matematičkih i jednu branching instrukciju. Ova komanda, VLIW kontroliše čitav SIMD blok ALU jedinica, koje rade na istom ili srodnom thread-u u datom trenutku. SIMD jedinice izvršavaju svaki thread paralelno i to na više elementarnih nivoa (5 matematičkih operacija uz obavezan flow control). Zato se kaže da je dizajn Cypress i Barts GPU-ova “VLIW5” tipa. Unutar svakog shader programa postoji specijalna instrukcija koja kontroliše, odnosno opisuje kako bi kod trebalo da se izvrši pod određenim (važećim) uslovima. Niz ovih instrukcija kroz nekoliko povezanih ili jedan (veći) shader program se zajedno nazivaju – flow control. Zahvaljujući preciznom Dispatch Processoru i već pomenutim arbitrima, sve operacije unutar jednog thread-a se izvršavaju paralelno kroz celu SIMD jedinicu, uz napomenu da se Texture i Vertex Fetch operacije prosleđuju i izvršavaju odvojeno.
       

      Neke stvari su kod Barts GPU-a ipak značajno unapređene, ali ih je veoma teško opisati rečima, a mi ne želimo da prenosimo matematičke formule i primere koda koje bi uskom delu čitalaca mogle da objasne kakva su poboljšanja postignuta na GPU compute nivou, a sve zbog povećanja efikasnosti ALU jedinica uopšte, ali i u radu sa tipskim shader programima. AMD navodi da je instrukcioni set DirectX 11, DirectCompute 11 i OpenCL-a praktično potpuno implementiran u hardveru. Ono što je konkretno poboljšano unutar svakog od SIMD blokova, a da je lako preneti “na papir” je i lokalna short-term bafer memorija koja se koristi za internu komunikaciju, a koja je kao i kod Cypress-a iznosi 32KB, što važi i za memory export buffer od 64KB (prosleđuje i do 64 32-bitne obrađene paket-instrukcije po kloku).

      Unapređenja i… razlike

      Maksimalna processing moć Cypress GPU-a je na Radeon HD5870 kartici čitavih 2.7 TeraFLOPS-a što je ipak više od onoga što nudi Radeon HD6870 sa svojih 2 TeraFLOPS-a. Ipak, razlike u performansama nisu takve, pa je u najvećem broju slučajeva Radeon HD6870 brz kao i HD5870, najpre zbog viših radnih učestanosti, a onda i boljeg balansa SP jedinicama sa TMU i ROP delom GPU-a. Kao i kod Cypress-a, izostavljene su tradicionalne jedinice za interpolaciju unutar setup engine-a, čiju funkcionalnost sada preuzima shader procesor. Naime, ove funkcije su sada objedinjene  unutar DirectX 11 kao jedan od njegovih feature-a i nazivaju se pull-model interpolation. Osim uštede u “tranzistorima”, ovaj deo sada i nema fiksnu funkciju i prilično je programabilan, što omogućava veću kontrolu nad funkcijama interpolacije tj. prikaza 3D površina sve do nivoa kontrole prikaza tekstura i filtriranja istih! Pored toga, interpolacija unutar posebne jedinice je u nekim situacijama postajala korak koji je usporavao i bio usko grlo u pripremi scene, a novi programabilni pull-model koji se oslanja na shader sada je dosta bolje izbalansiran (više se koristi u teksturno intenzivnim scenama koje imaju manje vertex operacija, odnosno manje u scenama sa manje tekstura i više “geometrije”), a s obzirom na daleko veću computing moć shader dela GPU-a, jasno je da će i na ovom polju, Barts biti, klok za klok, efikasniji od prethodne generacije. Ovo je jako bitno za efikasnost tesselation jedinice.
       

      Da je dizajniranje GPU-a i pomalo nezahvalan posao (najpre jer se budućnost ne može predvideti), pokazuje i  činjenica da je Cypress imao implementiranu i jednu instrukciju koju nije koristio ni DirectX 11, a ni OpenCL, ali koja je, potencijalno mogla biti vrlo korisna u komunikaciji na nivou kompajlera i prevodioca, a čija je implementacija u drajverima, kako se pokazalo, isuviše komplikovana i, uz sve to, ne može na pravi način da se iskoristi u kodu aktuelnog softvera. U pitanju je SAD instrukcija (Sum of Absolute Differences), koja je mogla da se koristi pri enkodingu video sadržaja i rada sa sličnim setom instrukcija tj. susednim setovima thread-ova koji se međusobno malo razlikuju (a takvi su vrlo česti). Prilikom enkodovanja HD videa, Cypress je emulirao SAD instrukciju putem deset do petnaest posebnih instrukcija, koje se ponavljaju u svakom sledećem koraku. Hardverski implementirana SAD instrukcija znači da se ona može obaviti u jednom klok ciklusu, što može da omogući i enkoding video materijala rezolucije četiri puta veće od FullHD-a, samo kad se implementira unutar drajvera. SAD se, kao što smo naveli, može iskoristiti kao zamena za različite tipske instrukcije prilikom rada sa kompajlerom. Ipak, ova instrukcija je, što nam je lično potvrđeno direktno iz AMD-a, izbačena iz Barts hardvera uz opasku da ju je pri dizajniranju Cypress-a, AMD implementirao isuviše rano i da će njeno vreme tek doći. Takođe, rečeno nam je da je “nešto slično” već dodato u novi Unified Video Decoder Engine (treća generacija).
       

      Dakle, Barts nastavlja VLIW5 dizajn, što znači da u jednom ciklusu paralelno radi pet ALU jedinica (četiri jednostavne X, Y, Z, W i jedna T jedinica, a sve – zajedno sa jedinicom za grananje (branching unit). Jedinicu T smo nazvali tako zbog mogućnosti izvršavanja trigonometrijskih (transcendental) funkcija (sin, cos, log, exp). Tako, po klok ciklusu, jedan stream procesor može da izvrši četiri 32-bitne floating point multiple+add instrukcije, četiri 24-bitne Integer multiple ili add instrukcije, dok za isto to vreme, specijalna, T-jedinica izvršava jednu 32-bitnu multiple+add instrukciju.

      SIMD jedinica je organizovana na isti način kao i kod Cypress-a. U svakom SIMD-u ima 80 SP jedinica (16 x 5), a lokalna L1 keš memorija po SIMD-u je 16KB (8KB L1 za compute), dok je broj teksturnih jedinica “dodeljenih” svakom SIMD-u i dalje četiri. Pošto Barts ima više radne učestanosti, ROP jedinica je jača u odnosu na Cypress, jer je sam broj ROP jedinica isti – 32 unit-a.

      Render Back-End

      Render Back End jedinica koja se nalazi “na kraju” rendering endžina, popularni ROP (raster operator) je takođe jako sličan onom kod Cypress-a. Zadržan i redizajniran je deo za rad sa custom-filtered AA sempl modovima umekšavanja ivica na objektima, jer omogućava teksturnim jedinicama da direktno pristupaju i čitaju podatke  iz specijalizovanih bafer memorija koji sadrže informacije o bojama piksela na objektima na kojima se izvršava antialiasing. Pored standardnog multisampling AA algoritma i već poznatog, novog custom sample AA metoda, AMD se ponovo vratio supersampling antialiasing-u. Podsećanja radi, supersampling je najzahtevniji metod umekšavanja ivica koji praktično renderuje čitavu scenu u većoj rezoluciji, a onda je skalira u rezoluciju u kojoj se ona prikazuje (jedini pravi FSAA u pravom smislu te reči), dok se multisampling samo fokusira na ivice objekata. Supersampling i dalje daje najbolje rezultate, pa se uvek koristi kod offline render sistema, ali se manje koristi u realtime grafici zbog svoje neefikasnosti. Naravno, custom sample antialiasing metodi su zadržani kao neka vrsta trademark-a i najboljeg odnosa performansi i kvaliteta, baš kao što je slučaj i sa coverage sample antialiasing algoritmima kod GeForce kartica. Kroz programiranje, tj. drajvere, dodat je i još jedan mod antialiasing-a (morphological AA), ali ćemo o njemu više reći nešto kasnije.
       

      I rad sa multiple render target-ima (MRT) je poboljšan, jer je AMD uveo još efikasniji sistem za brzo pražnjenje pomenutog bafera, kako bi bio spreman za sledeći ciklus. Prethodno pomenute L2 keš memorije, koje su ovoga puta dvostruko veće i četiri puta efikasnije u odnosu na iste u prethodnoj generaciji bi trebalo da smanje pad performansi kada se koristi viši nivo multisampling antialiasing-a (8x u odnosu na 4x), ali će u svakom slučaju pomoći da se bolje iskoristi memorijski bandwidth.

      Na ROP jedinicu je “vezana” L2 keš memorija – četiri puta po 128KB L2 cache-a, koji se direktno nastavljaju na četiri 64-bitna memorijska kontrolera, što, naravno, znači da Barts zadržava i ukupno 256-bitnu memorijsku magistralu. Kontroler kod Barts-a je praktično “preuzet” od Cypress-a, a ako se setimo da je na istom rad sa VRAM-om bio dodatno optimizovan tako da sada i GDDR5 čipovi imaju mogućnost rada na znatno nižim naponima (u 2D i intermediate režimu), Radeon HD6870, dok prikazuje desktop, troši svega 19W struje, što je fantastičan podatak. Maksimalna potrošnja Radeon HD6870 kartice je svega 151W!

      Memorijski kontroler

      Kao što smo već pomenuli, memorijski kontroler se sastoji od četiri manja kontrolera širine 64 bita, baš kao što je slučaj i sa Cypress čipom, ali i prethodnicima – RV790, RV770 i RV670. Barts koristi GDDR5 tip memorije i to je već peta generacija Radeon kartica koja koristi ovaj tip memorije. AMD je i ranije odustao od ring-bus sistema memorijskog kontrolera i vratio se onom koji po organizaciji više podseća na klasičan crossbar tip. Međutim, novi memorijski kontroler je dodatno optimizovan za rad sa ultra brzom GDDR5 memorijom. Osim većih bafera o kojima smo već pisali, a koji se nalaze “između” render back-end dela i memorijskog kontrolera, više frekvencije su postignute uvođenjem EDC sistema (Error Detection Codes) i kompenzacijom temperature.  EDC je zapravo CRC check na svakom od transfera podataka. Treća dodatna funkcija je i mogućnost promene radne frekvencije memorije i njenog napona, pri promeni aktivnog stanja čitavog akceleratora (ovo je i ranije bilo moguće, ali je radni napon memorije uvek ostajao isti). To je konačno omogućilo da Radeon HD6870 akcelerator troši izuzetno malo u stanju mirovanja, što je danas izuzetno bitna stavka, bar ako želite da idete u korak sa vremenom.

      EDC sistem i nešto o čemu AMD ne želi previše da priča (Memory Clock Temperature Compensation), ma koliko koktela popili sa ljudima koji su radili na ovim memorijskim kontrolerima :)), je verovatno razlog zbog čega je Radeon-ov memorijski kontroler efikasniji i bez bagova u odnosu na onaj kod GeForce GPU-ova. Ovi trikovi kod Cypress GPU-a omogućavaju još viši efektivan “klok” VRAM-a, koji sada bez problema ide od 5 GHz (1250 MHz, realno). Svakako, memorijski propusni opseg je povećan, a PCB nije dodatno zakomplikovan. Ipak, bandwidth se realno i nije mnogo povećao još od Radeon HD4890 generacije, koja je u svoje vreme imala impresivne VRAM performanse. S obzirom na to da je computing deo GPU-a pojačan duplo, a memorijski podsistem, u odnosu na Radeon HD4890 – tek za tridesetak procenata, sasvim je moguće da bi Northern Islands arhitektura, u ekstremnim rezolucijama tek mogla da pokaže koliko može kada bi se pojavila znatno brža memorija ili kada bi se na čip implementirala 512-bitna memorijska magistrala.
       

      Međutim, u odnosu na Cypress je, radi uštede, kod Barts-a napravljen, uslovno rečeno, mali korak u nazad. Ono što je takođe interesantno i što smo saznali u razgovoru sa gospodinom koji je razvijao memorijski kontroler i radio sa Džo Makrijem u vreme kada je razvijan RingBus i kada je implementiran GDDR3 standard je činjenica da je kod Barts-a iskorišten nešto manje kompleksan memorijski kontroler, koji je, zapravo, preuzet sa Redwood GPU-a! Zbog čega? Redwood-ov memorijski kontroler je čak dva puta manji od onog kod Cypress-a. Ono što nam ranije nikako nije padalo ni na pamet je da je upravo kompleksnost Cypress-ovog memorijskog kontrolera razlog zbog koga na ovog GPU-u GDDR5 čipovi mogu da rade i na 4.8 GHz, dok se kod Barts-a pokazalo da to baš i nije slučaj. Default takt bi, u suprotnom, za VRAM bio daleko viši, a kako će se kasnije pokazati, Radeon HD6870 nema tako “overklokabilan” VRAM kao poslednje serije Radeon HD5870 kartica (dobar primer je ASUS Radeon HD5870 V2). Trik je, dakle, u kontroleru i onim “sitnicama” o kojima smo pisali iznad. Da li to znači da je Barts-ov (i Redwood-ov) memorijski kontroler lišen Memory Clock Temperature Compensation i Error Detection Codes sistema, nismo mogli da saznamo, ali je sasvim verovatno da jeste, jer smo ipak saznali da je izbacivanjem “pojedinih funkcija” ili, ako hoćete, preuzimanjem Redwood memorijskog kontrolera, na transistor count-u, AMD uspeo da uštedi skoro 50%, što je takođe fascinantna cifra. Ipak, verujemo da je Cayman, koji je veći GPU i od Cypress-a, imati full-featured AMD memorijski kontroler sa svim poslednjim tehnologijama koje inženjeri ove kompanije imaju u rukavu.

      Još jedna stvar koja je preuzeta sa kartice prethodnoe generacije – ovoga puta sa Cypress-a, jer je dokazano efikasna, vezana je za činjenicu da GPU ima mogućnost samo-regulacije naponske jedinice. Naime, regulatori napona mogu GPU-u obezbediti tačno onaj napon koji mu vi zadate (putem soft-mod-a u bios mod aplikaciji), a isto važi i za regulator napona video memorije. No, da ne bude da u odnosu na Cypress ništa zapravo nije bitno unapređeno, tu je i potpuno redizajnirana tesselation jedinica, kao i novi UVD 3.0 video engine i novi display kontroler, o kojima ćemo pisati nešto kasnije. Za sada se zadržavamo bliže središnjem delu GPU-a, u kome se nalazi i novi tesselation unit.

      Tesselation x2

      Shader Model u verziji 5.0 je High Level Shader Language (HLSL) koji pruža još dodatnih i novih načina za implementaciju shader programa. U odnosu na prethodnu verziju donosi podršku za double-precission, odnosno podršku za još duže i kompleksnije shadere. Hardverski tesselator je bio prisutan i u RV870 GPU-u, koji ATI razvija još od 2001. godine, a koji je u praksi najviše korišten unutar Xenos GPU-a kod Xbox 360 konzole, sada je podržan i od strane DirectX 11 API-ja. Dalje usložnjavanje objekata putem sub-division algoritama je moguće izvesti na više načina, ali su u DirectX 11 API-ju podržani Hull Shader i Domain Shader algoritmi. Jasno je da Tesselator samo može da učini da uglastiji objekat postane obliji, što će biti od pomoći na nekim objektima i terenima, ali ne može da kreira neke suptilne detalje na objektu, koje sam dizajner nije predvideo na njemu. Zato je za postizanje finih detalja na objektima i dalje neophodno koristiti displacement mape, kakve su bump teksture ili occlusion mape, koje se mogu koristiti i u sprezi sa transparentnim detailed mapama koje dodaju detalje na objektima sa baznom kolor teksturom bez potrebe da ista bude u ultra-visokoj rezoluciji.
       

      U AMD-u smatraju da brute force pristup ne vodi ničemu i da je bolje imati optimalne performanse pri dobro izbalansiranom načinu dizajniranja 3D scene. U ovom slučaju, govorimo  o performansama tesselator jedinice. Kao što možete videti na chart-u iznad, Barts je oko dva puta brži od Cypress-a kada se koriste faktori deljenja između 6 i 10 piksela po poligonu i oko 50% brži na nižim faktorima i onim koji su viši od 13-14 piksela po mesh-u (poligonu). Efikasnost tesselation jedinice i više radne učestanosti su još dva razloga zbog kog Barts, u modernim igrama, u kojima se intenzivno koristi tesselation na Radeon HD6870 kartici može da susitgne, a nekad i prestigne Cypress na Radeon HD5870 modelu.
       

      Na SIGGRAPH manifestaciji, AMD je objavio white paper koji govori o pogrešnoj implementaciji tesselation jedinica u postojeći DirectX 11 hardver. Tesselation jeste jedna od ključnih karakteristika Direct3D 11 API-ja, ali AMD navodi da se preterana upotreba teselacije na aktuelnom hardveru (i testirana kroz današnje benchmark programe kakvi su Unigine Heaven ili 3Dmark) ne donosi viši kvalitet slike, već samo “rasipa” resurse. Istina, ako govorimo o rezoluciji 1920 x 1080 piksela i Radeon HD5970 akceleratoru ili novom Radeon HD6970 modelu, onda je jasno da se faktor deljenja može povećavati “unedogled”. Ali ako želimo dobre tesselation performanse na kartici kakva je Radeon HD6870 u EyeFinity rezolucijama (5760 x 1080 piksela), potrebno je da najmanji poligon (triangle) nekog objekta nakon deljenja ima do 16 piksela. Problem, zatim, nastaje kada se u scenu koja koristi znatno intenzivniju teselaciju, primeni i Multisampling Antialiasing algoritam, kada dolazi do znatnog pada performansi. AMD zbog toga radi sa studijima koji razvijaju gaming engine i same igre, kako bi se tesselation funkcija koristila na optimalan način – za postizanje odličnog kvaliteta 3D scene i, istovremeno, dobrih tesselation performansi. Jedan od sistema je i klasična upotreba LOD trika na samoj primeni teselacije. Naime, Adaptive Tesselation upravo radi na tome da hardverski smanji nivo teselacije na udaljenim objektima (koji su često van fokusa tj. u depth-of-field-u) i istovremeno poveća nivo teselacije na objektima ili površinama bliskim „kameri“.

      Optimizacija Barts-a, balans i izbori

      Kroz čitavu priču o Barts grafičkom čipu do sada, isti smo poredili sa Cypress-om i možemo reći da novi GPU ima oko 75-76% snage svog prethodnika kada je u pitanju computing snaga (2.0 prema 2.7 TeraFLOPS-a), ali i kada je u pitanju shading ili texturing moć. To Cypress čini boljim “oruđem” za stream computing. S druge strane, novi, manji čip ima više rastering i tesselation moći, a kako mu je ROP jedinica ista, a radi na višem taktu, može se reći da je i render back-end za nijansu jači. Dakle, Barts je bolji za gaming, jer svakako ima više snage za rasterizaciju i primenu tesselation funkcije, ali i antialiasing metoda. Za gaming, Barts je mnogo bolje balansiran GPU, jer u odnosu na computing deo, ima mnogo snažniji rasterisation i ROP deo, tako da njegove performanse nikako neće biti 0.75% od onoga što pruža Cypress. Još jedna zanimljiva stvar koju smo saznali tokom deep-dive sesije je da se AMD razmišljao između dve varijante za dizajn Barts GPU-a. Jedna je imala veći broj SIMD klastera (16, umesto 14 SIMD, odnosno 1280 SP umesto 1120 SP jedinica), ali dvostruko manji ROP (kao kod Radeon HD4890 modela) – svega 16 ROP-a! Ipak, simulacije su pokazale da dizajn koji je prihvaćen, a to je 14 SIMD / 1120 SP jedinica i 32 ROP-a, dalje bolje performanse u igrama! To je još jedan pokazatelj da je AMD ovu karticu namenio prvenstveno igračima – dakle, za gaming i to ponajviše za DirectX 11 gaming.
       

      Dalje unapređenje anisotropic filtriranja

      Osim algoritama koji su i ranije bili prisutni, sada je tu i block texture compression mod koji je AMD osmislio i predložio da bude uključen u DirectX 11 specifikaciju. Ovaj algoritam podrazumeva efikasniju kompresiju, brži rad i viši kvalitet nakon rekompresije u odnosu na prethodna rešenja (bolji rad sa alfa-kanalima, transparentnim i FP16 HDR slikama, bolji signal-to-noise odnos, itd.), pa je sada moguća kompresija i u odnosu od 6 : 1 i to za teksture koje su prilično velike (čak 16.000 x 16.000 piksela).
       

      Osim sistema za kompresiju, AMD je dodatno poradio na kvalitetu anizotropnog filtriranja, što nije bilo toliko komplikovano kao što izgleda, s obzirom na to da smo već pomenuli kako je ova specijalizovana jedinica sada izbačena iz GPU-a i dodeljena, kao programabilna funkcija, u sam compute-shader deo GPU-a (streaming jedinice). AMD tvrdi da je novi algoritam jednako dobar kao referentni, emulirani Direct3D rasterizer, ali, naravno, neuporedivo efikasniji, jer nije ništa sporiji u odnosu na rešenje iz prethodne generacije. U ovom trenutku, dakle, AMD poseduje rešenje koje je bolje od konkurentskog, čak i kada se u ForceWare drajverima primeni high quality filtering. Čak i za običan trilinear filtering mod, AMD sada primenjuje full -true trilinear bez primene blending­-a koji je uvek bio uključen, kako bi se aproksimacija prethodnih, manje preciznih (tzv. adaptive trilinear) metoda, koje su se koristile radi boljih performansi, manje videla u igrama. Kako se sada ova operacija obavlja unutar shader jedinica, AMD je odlučio da poveća kvalitet prikaza i na tome im skidamo kapu. Zadržavanje adaptive trilinear metoda bi možda dodatno povećalo performanse (i dalje ga je moguće aktivirati u drajverima), ali je podrazumevano (default) podešavanje – full trilinear. Sve ove funkcije su postojale i kod Evergreen generacije GPU-ova, ali AMD je napravio dodatna poboljšanja kada je u pitanju anizotropno filtriranje tekstura.

      Kod Cypress GPU-a smo prvi put videli anizotropno filtriranje koje je potpuno nezavisno od ugla pod kojim se prikazuje neka površina (tekstura) – nešto sa čim je Radeon HD4000 i serije pre nje, imala poteškoća. Međutim, i novi AF algoritam, koliko god delovao savršeno, imao je poteškoća sa velikim ravnim površinama i teksturama koje imaju čest, sitan patern ponavljanja (metalne površine sa pravilnim urezima i sl.). U tom slučaju se jasno vidi razlika između dve mip-mape tj. iste teksture različitih mip nivoa (čuveni krugovi oko “igrača”). Taj problem nije do kraja rešen i vidljiv je na specifičnim teksturama koje se obično javljaju u trkačkim igrama ili u naučno-fantastičnim FPS naslovima. Kao što smo imali prilike da vidimo i u Los Anđelesu i ovaj problem je rešen, pa tako i ovoga puta i zvanično, AMD i dalje ima prednost kada je kvalitet filtriranja tekstura u pitanju.
       

      Morphological Antialiasing i Catalyst A.I. noviteti

      Osim poboljšanog anisotropic filtering algoritma, kod Barts GPU-a, AMD je uveo i nov tip antialiasing-a. U ovoj oblasti, NVIDIA je još uvek tradicionalno bolja, bar kada su u pitanju „pametni“ oblici antialiasing-a, a ne „brute force“ varijante kakav je SuperSampling. NVIDIA CSAA (Coverage Sample Anti-Aliasing) u kombinaciji sa alpha-to-coverage jako lepo radi u igrama koje se dešavaju u prirodi (drveće, trava i lišće se obično predstavljaju alpha-teksturama). Klasični antialiasing algoritmi se izvršavaju tokom pripreme scene, bilo da se radi o MSAA ili SSAA metodama ili novijim Transparency, Temporal MSAA varijantama ili čak Custom Sample AA algoritmima. Svi ovi metodi moraju da imaju neku vrstu detekcije ivice ili alfa kanala unutar teksture, ali se sam AA primenjuje pred sam kraj pripreme scene.

      Međutim, novi AMD-ov antialiasing algoritam je post-processing tipa. Naziva se Morphological Anti-aliasing (MLAA), radi u svim naslovima, bez obzira na API i primenjuje se na krajnju, 2D sliku. MLAA algoritam traži specifične vrste ivica na slikama, između kojih postoji velika razlika u kontrastu, a koji su udaljeni svega par piksela jedan od drugog. S obzirom na to da se primenjuje na običnoj 2D slici, MLAA je prilično nezahtevan metod, a ATI ga je već koristi na nekoliko generacija starom Xenos GPU-u unutar Xbox 360 konzole. Ovaj post-processing algoritam se obavlja u SP jedinicama, pa je moguće da će ga AMD „uključiti“ i kod Radeon HD5800 serije kartica.

      Njegova prednost je što je nezahtevan i što će umekšati sve ivice. S druge strane, pošto radi sa 2D slikom, nije baš preterano „bistar“, pa će možda umekšati (zamutiti) i sliku tamo gde to nije potrebno, što dovodi do gubitka detalja. Ipak, sa njim možete eksperimentisati – pokazalo se da su SSAA i MSAA metodi često dosta zahtevni za igre kao što je Crysis (na Ultra podešavanjima), pa proverite da li će MLAA dati bolje rezultate u odnosu na situaciju kada nikakav AA nije primenjen. SuperSample Anti-Aliasing metod i dalje daje najbolji kvalitet prikaza – najstariji je i najkompatibilniji sa igrama, pogotovo ako se uključi i alpha-to-coverage, dok je MSAA negde između, a pruža jako dobre rezultate ako se aktivira adaptivni AA i transparency metod.
       

      Nakon ove priče, na scenu je izašao naš omiljeni Grk i prijatelj Teri Makedon, lider Catalyst tima, koji je pričao o EyeSpeed i drugim novinama i optimizacijama unutar drajvera. Jedna od zanimljivih novina je i novi Catalyst A.I. slajder koji omogućava da se dodatno podesi nivo optimzacije u radu sa teksturama. Sada se pod Texture Filtering Quality opcijom pod Catalyst A.I. nalaze tri opcije  – High Quality, Quality (podrazumevana) i Performance. High Quality praktično isključuje Catalyst A.I., dok Quality uključuje dve opcije koje su se ranije nalazile pod posebnim „tabom“, do kog se teško dolazilo (enable trilinear optimization i anisotropic sample optimization). Takođe, Teri Makedon je pomenuo da je sada svaki sRGB prikaz uz pomoć Radeon HD6000 serije kartica propisno kolorno kalibrisan, što će dosta značiti vlasnicima Wide Color Gamut LCD / TFT ekrana.
       

      AMD EyeFinity

      Kontroler koji omogućava prikaz slike na ekranu je potpuno redizajniran da se može reći da je ponovo kreiran – od nule. Naime, on sada podržava sve tipove video konekcija, od D-Sub-a, preko DVI-I i HDMI konekcije, pa sve do Display Porta u verziji 1.2. Osim toga, novi display controller nudi mogućnost prikaza do čak šest video stream-ova uz preciznost od 10-bita po komponenti (boji). Ovaj programabilni deo GPU-a je tako i u mogućnosti da prikaže jedan “ekran” u fantastičnoj rezoluciji od 5760 x 2160 piksela. Štaviše, u ovoj rezoluciji se možete i igrati!
       

      Na prvih nekoliko strana smo pominjali i mogućnost da Radeon HD5870 akcelerator prikaže sliku na čak šest monitora. Svakako, za tako nešto vam je potrebno specijalno izdanje koje se naziva Radeon HD5870 Eyefinity6 Edition. Danas je to moguće učiniti sa samo jednom karticom, uz pomoć dodatnih adaptera, ali čak i bez njih možete da sastavite tri ekrana i radite u fantastičnih 5760 x 1080 piksela. Sa dve kartice, ako se upotrebi svih šest displeja, maksimalna rezolucija za svaki od njih se spušta na 1920 x 1080 piksela, što ukupno daje mod od 5760 x 2160 piksela! I da, u ovoj rezoluciji možete igrati Crysis, Flight Simulator, Dirt 2, Need For Speed ili skoro bilo koju aktuelnu igru koja vam padne na pamet. Naravno, za solidne performanse u tako monstruoznim grafičkim modovima će biti neophodno i da dodatno osnažite grafički podsistem sa još jednom, dve ili tri Radeon HD6870 kartice, ali ako baš imate viška para, prostora i sebe smatrate ultimativnim igračem, dobro je znati da je i ovako nešto moguće. Štaviše, u CrossFire X varijantama je moguće povezati čak i 24 monitora, što će se retko viđati i na sajmovima, ali je sjajna demonstracija sile! Uostalom, za igranje u 5760 x 2160 piksela, mogli biste da sačekate mesec dana i pazarite dve Radeon HD6970 kartice. Ili dva DualGPU Radeon HD6990 modela!
       

      Kod Northern Islands serije GPU-ova, AMD je modernizovao i tipove video-out konekcija. Radeon HD6800 kartice podržavaju i stižu sa HDMI 1.4a portom, koji podržava Blu-ray 3D. Tu je i podrška za novi DisplayPort u verziji 1.2, koji takođe podržava 3D. DisplayPort 1.2 zapravo ima dovoljno veliki bandwidth da prikaže sliku na čak četiri FullHD ekrana u 1080p rezoluciji (za to je, ipak, neopdodan Multi-Stream-Transport hab (MST hab)) ili čak dva ekrana u rezoluciji 2560 x 1440 piksela, što je korisno znati ako imate dva 30-inčna monitora. Dva DVI konektora na kartici nisu ista, pa jedan daje maksimalnu rezoluciju od 2560 x 1600 piksela (Dual-Link DVI), a drugi 1920 x 1440 piksela (Single-Link DVI). Pogledajmo sada kakve kombinacije za konekcije je predložio AMD tokom svoje prezentacije:

      Mi smo tokom prezentacije postavili pitanje koje je glasilo: zbog čega je bilo potrebno kreirati novi standard kakav je DisplayPort i zar HDMI 1.4x nije bio dovoljan, na šta smo dobili odgovor da se kontroleri za DisplayPort prave u tehnološki novijem postupku, da je DP kontroler daleko jednostavniji i brži za implementaciju i da ga, za razliku od inertnog HDMI standarda, svi u IT-ju prilično „vole“. Bez obzira na to, DisplayPort nije konkurent HDMI standardu, već je naslednik DVI konekcije, baš kao što je ona (konačno) uspela da zameni D-Sub priključak. Osim toga, DisplayPort 1.2 ima značajan broj prednosti u odnosu na DL-DVI, pa čak i HDMI 1.4, a to su:

      znatno viši propusni opseg (DisplayPort 1.2 ima dva puta veći bandwidth od verzije 1.1 i podržava istovremeni protok različitih display tajminga i rezolucija, ali i osvežavanja i dubine boja)
       

      DisplayPort 1.2 je neophodan za prikaz Ultra-HD rezolucija (Radeon HD6800 kartice mogu da prikažu sliku na jednom ekranu, putem jednog DP priključka čak i u rezoluciji 4096 x 2160 piksela pri osvežavanju od 50 Hz)
       

      za razliku od HDMI i DVI standarda, DisplayPort omogućava povezivanje uređaja putem jako dugačkih, pasivnih kablova
       

      podržava prenos audio signala, za razliku od DVI konektora
       

      podržava prenos različitih tipova signala i originalnog TMDS signala sa karakteristikama koje su pogodne za DVI ili HDMI, pa je zato jako lako i jeftino napraviti DP-DVI ili DP-HDMI adaptere
       

      HDMI je pogodan za prenos 3D stereoskopskih slika u rezoluciji od 1920 x 1080 piksela pri 30 fps, ali je za veći frejmrejt potrebno ići na DisplayPort 1.2
       

      DisplayPort 1.2 ima propusnu moć od 17 Gbit/s, što je dovoljno za prikaz slike na četiri 1080P ekrana pri osvežavanju od 60 Hz ili dva 2560 x 1600 displeja pri istom 60 Hz osvežavanju, odnosno 3D sliku na 2560 x 1600 piksela uz osvežavanje od 120 Hz.
       

      Unified Video Decoder (Engine) 3.0 i APP

      Prva generacija AMD Unified Video Decoding engine-a je već bila dovoljno usavršena i o njoj smo više puta pisali. NVIDIA grafičkih procesori od G84 na ovamo, kao i nova familija Radeon HD2000 (bez 2900XT i Pro modela) i HD3000 akceleratora imaju posvećeni video processing engine koji ATI naziva Unified Video Decoder. U odnosu na AVIVO, UVD je napredovao koliko i PureVideo HD druge generacije u odnosu na rešenje iz GeForce 7 familije, a nakon njegovog izostanka ili nefunkcionalnosti kod R600 kartica, našao je svoje mesto kod aktuelne HD3800 serije. AMD tvrdi da je smanjenje CPU utilizacije pri posmatranju H.264, a posebno VC-1 video formata, koji su postali standardni video kodeci za BluRay naslove zaista vredno pažnje, čak i na desktop sistemima. Prilikom obrade HD video signala, pred grafičkom karticom stoji izazov koji se ne završava samo na procesiranju bar 6x više informacija u odnosu na video signal standardne definicije. Jednostavno rečeno, grafičke kartice poseduju specijalnu logiku koja im objašnjava kako da brojne shader jedinice iskoriste za obradu video signala. Pošto su GPU-ovi sve moćniji, zbog čega stati na 1080p rezoluciji? AMD je proširio podršku i za XHD rezolucije, što nam nije teško da zamislimo jer, ako ove kartice bez problema rade sa stotinama tekstura visoke rezolucije koje “lepe” na hiljade poligona u 3D igrama, zbog čega ne bi mogle da, tridesetak puta u sekundi, nalepe jednu “teksturu” na jednu površinu na ekranu. Naravno, jasno je da se na tu “teksturu” primenjuju malo zahtevniji algoritmi od običnog trilinear ili anisotropic filtera, brinuti o daljem toku podataka, korekciji i kompenzaciji pokreta, de-interlacing-u, 3:2 ili 5:5 pulldown-u (RealCinema 24p) i tome slično, ali je sve to, složićete se, i dalje manje kompleksan “shader program” od “sličnih” rutina u modernim igrama.
       

      Početne BitStream i Entropy Decode faze se sada izvršavaju od strane GPU-a. UVD je kreiran da u potpunosti dekodira i najzahtevnije (i najnaprednije) video kodeke kakvi su VC-1 i H.264, uključujući i bitrate od 40 Mbps ili više i koristi već postojeća, programabilna SIMD jezgra, odnosno Stream Processors jedinice. Ono što Radeon GPU-ovi podržavaju još od prve generacije UVD „endžina“ , a od nedavno i konkurencija sa novim GPU-ovima, naziva se full-speed CABAC i CAVLC dekodiranje u okviru H.264 i VC-1 kodeka. Sav postprocessing se obavlja unutar shader jedinica, uz primenu filtera koji su ništa drugo do namenski kreirani shader programi koji se u potpunosti izvršavaju in hardware. HDMI, odnosno High Definition Multimedia Interface je u potpunosti podržan od strane RV670 i novijih AMD GPU-a, zajedno sa obaveznim HDCP (High-bandwidth Digital Copy Protection) sistemom zaštite od kopiranja. Osim digitalnog signala, HDMI konektor “prenosi” i više kanalni audio zvuk, koji RV770, kao i RV790 i RV870 podržavaju. Novina kod Cypress GPU-a bila je hardverski upscale 1080p filmova u rezoluciju 2650 x 1600 piksela, što zaista izgleda impresivno. Novine UVD 2.0 endžina su bile:

      Hardware acceleration dekoding za dva 1080P HD stream-a

      Kompatibilnost sa Windows Aero modom  – reprodukcija HD video klipova uz aktivan Aero Glass mod na desktopu

      Video gamma – gamma kontrola je nezavisna od iste koja važi za Windows desktop

      Brighter whites – Blue Stretch procesiranje povećava vrednost svetlijih tonova za dinamičniji prikaz videa

      Dynamic Video Range – bolja dinamička kontrola tamnih tonova i crne tokom reprodukcije

      Dodate su i funkcije Dynamic Contrast Enchancement i Dynamic Color Enchancement za koje već iz samog naziva možete da predpostavite koju ulogu imaju. Kod prethodne generacije UVD-a smo imali podršku za maksimalno 5.1, 16-bit PCM Stereo ili kompresovani AC3 5.1 više kanalni audio-stream po Dolby Digital i Dolby DTS standardima, ali je to kod RV770 i novijih čipova sve dovedeno na viši nivo – sada je podržan osmokanalni (7.1) audio uz maksimalan bitrate od 6.144 Mbps i sempling od 192KHz i 24-bita. Podrška za “filmske” formate se ne zaustavlja na Dolby DTS i Digital standardima – tu su sada i True-HD i DTS HD formati u koje se slažu zvučne slike na novim BluRay izdanjima. Još jedna od bitnih novina je i mogućnost dual-stream plejebeka, pa Cypress može da pusti dva HD video feed-a i to u modu “slika-u-slici” sa kompletnim de-kodiranjem kroz VC-1, H.264 i MPEG-2 (uz upscaling DVD formata u HD rezolucije i nove profile sa dinamičkim kontrastom).

      Treća generacija Unified Video Decoder “endžina” donosi vrlo bitne novine. Među najbitnije dve je hardverska akceleracija 3D Blu-ray video kodeka (MVC), kao i MPEG-2 dekoding, koji se sada u potpunosti obavlja unutar GPU-a. MPEG 4 Part 2, poznatiji kao DivX, sada se takođe dekodira hardverski, unutar GPU-a.

      Takođe ćemo pomenuti da je AMD preimenovao ATI Stream u AMD Accelerated Parallel Processing (APP), koji se oslanja na OpenCL kao standard za taskove koji podrazumevaju veliku paralelizaciju u radu (obrada i rendering video materijala npr.). I dok NVIDIA za svoj zatvoreni CUDA sistem ima poseban sajt (CUDA Zone), AMD je kao podršku za otvoreni standard kreirao sajt OpenCL Zone. AMD, naravno, podržava i jedan od standarda koji nije jednako otvorenog koncepta, ali je deo „nezaustavljive“ mašinerije zvane Microsoft DirectX 11 – naravno, radi se o DirectCompute 11 standardu. Naravno, APP nije stvar koja je rezervisana samo za grafičke kartice, jer će se OpenCL i drugi otvoreni API-ji i razvojna okruženja izvršavati i na x86 procesoru kakav je AMD Fusion. Zapravo, GPU deo Fusiona će se oslanjati na OpenCL i DirectCompute 11, a CPU na x86 instrukcije. APP SDK u verziji 2.2 se može preuzeti sa AMD-ovog sajta.
       

      Open Stereo 3D inicijativa

      Za razliku od takođe zatvorenog NVIDIA 3D Vision standarda koji zahteva 120Hz monitor i kupovinu NVIDIA 3D Vision paketa aktivnih shutter naočara (koje nam se ne sviđaju najviše na svetu, najpre zbog “stakala” male površine), AMD je za Northern Islands familiju kartica kreirao (ili bar krenuo da kreira) čitav ekosistem “third party” rešenja za postizanje efekta treće dimenzije, sa kojima je kompatibilan. Pošto podržavaju različita rešenja, u AMD-u navode da to korisnicima daje mogućnost izbora. Recimo, ako već imate skupu Panasonic 3D plasmu (46VT25), zbog čega je ne biste iskoristili za igranje igara sa računara? Zbog čega biste, za 3D igranje na računaru morali da kupujete nekakav TN Film monitor i neudobne shutter naočare, pored već sjajnih Panasonic-ovih?

      Ili, ako imate neki od vertikalno polarizovanih LCDTV uređaja i pasivne, odgovarajuće naočare sa polarizovanim staklima, zašto da ne iskoristite ovaj sistem? U svakom slučaju, između vašeg 3D iskustva sa jedne i aplikacije (igre) i drajvera sa druge strane, stoji posebna vrsta softvera (tzv. middleware), koji od 3D igara kreira prave, stereoskopske – 3D igre. Kompanije kao što su DDD ili iZ3D već imaju gotova rešenja koja su demonstrirana upravo na launchu Radeon HD6800 karticau Los Anđelesu. Mi smo imali prilike da igramo igre Deus Ex 3 i Medal of Honor uz pomoć aktivnih, odnsono pasivno polarizovanih Oakley 3D naočara i bili smo gotovo fascinirani onim što smo videli. Rešenje svakako nije lošije od NVIDIA 3D Vision-a, ako u nekim momentima nije i bolje. I, posle nekog vremena ne dolazi do zamora u očima. Softver, koji je zapravo driver wrapper, iz kompanija DDD i iZ3D već sada ima preko 400 profila za aktuelne 3D igre. I što je zanimljivo, ovaj softver radi i sa NVIDIA grafičkim karticama, pa ako se odlučite za GeForce, a ne sviđa vam se njihov 3D Vision sistem, znajte da postoji izbor.
       

      Ovim smo došli do kraja predstavljanja tehnologije vezane za Northern Islands generaciju grafičkih kartica. U tekstu koji sledi, predstavićemo referentne Radeon HD6870 i HD6870 akceleratore koje smo doneli iz Sjedinjenih Država, a onda i njihove performanse u čak 20 aktuelnih i novih igara u kojima ih poredimo sa direktnim konkurentima i prethodnicima iz sopstvene kategorije.

      Ostanite uz nas!

      Ostani u toku

      Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

      Hvala!

      Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

      Možda vam se svidi
      X870E Aorus Pro i X870 Aorus Elite Wi-Fi7 test