AMD Radeon HD5770
Tek pre nešto više od nedelju dana je prošlo od kako smo predstavili nove Radeon HD5870 video kartice i objasnili šta to novo donose, a one su se pojavile i na našem tržištu – u slobodnoj prodaji. S obzirom na samo tržište, kao i činjenicu da ekonomska kriza kod nas i dalje ne jenjava, potražnja za ovim modelima je, može se reći, sasvim solidna, što nas prilično raduje. Međutim, nije svako spreman da odvoji preko 300 evra za grafičku karticu, iako smo pri opisu prošle NVIDIA generacije kartica, ovu rečenicu već jednom napisali, s tom razlikom što je umesto fraze “više od 300”, stajala “nešto više od 600 evra”. Iako smatramo da je to realna cena za karticu koja nudi gotovo tri TeraFLOPS-a computing moći, što je tek nešto manje od tri najjače NVIDIA Tesla kartice zajedno (pre nego što se pojavi Fermi verzija), AMD želi da i HD-gaming spusti u mase. Doduše, performanse po uloženoj novčanoj jedinici neće biti bitno veće, bar za sada, ali Radeon HD5770, koji danas predstavljamo, svakako služi da se DirectX 11 spusti “u mase”, a to je osnovni preduslov da izdavači konačno na tržište puste prve igre koje koriste benefite nove verzije Microsoft-ovog “igračkog” API-ja. Radeon HD5770 je, za aktuelne pojmove, mali GPU. Svakako, poseduje oko milion tranzistora, ali je izrađen u 40-nm procesu i praktično predstavlja derivat Cypress tehnologije. Po “snazi” je u rangu sa RV870, odnosno Radeon HD4890 GPU-om, s tim što sa video memorijom komunicira putem 128-bitne magistrale, što će pokušati da kompenzuje višim radnim učestanostima. Ipak, kako AMD već koristi najbrže dostupne GDDR5 čipove, sumnjamo da će Radeon HD5770 biti u stanju da prestigne Radeon HD4890, mada, sa njim i ne bi trebalo da se poredi. No, o samom grafičkom čipu, pozicioniranju i samoj kartici ćemo više reći nešto kasnije.
Kao što smo već pisali, ovo je treći put da AMD primenjuje svoj novi poslovno-tehnološki model. Pre dve godine, imali smo Radeon HD3800, a onda je stigao i HD4800 – druga, te treća generacija GDDR5 kartica. Uz njih je stigla i podrška za DirectX 10.1 i Shader Model 4.1. Sa jedne strane, AMD se posvetio optimizaciji i ubrzanju kompleksnije 3D grafike, a NVIDIA, donekle u ćorsokaku sa skupim i ne-modularnim GT200, okrenula se promociji ubrzanja fizike i zatvorenom GP-GPU standardu, koji naziva CUDA. NVIDIA Tesla kartice bazirane na GT200 čipu su poručivane za budžetske super-kompjutere, koji svakako nemaju loš odnos cene i performansi, ali se ne može reći da odgovaraju baš svim ustanovama, jer je optimizacija softvera i dalje nešto na šta većina uhodanih sistema ne želi da troši vreme i novac. Kada se pojavi Fermi (GF100), NVIDIA će ponovo podržavati i otvorene GP-GPU standarde (OpenCL), kao i one koji će verovatno biti brže podržani (DirectCompute 11) od strane programerskih zajednica svih tipova. Ako se prisetimo i činjenice da se grafički adapteri danas sve češće koriste i za akceleraciju general-purpose aplikacija, a ne samo grafike, jasno je da GPU kao takav postaje sve bitniji, jer će biti važan i korisnicima koji se uopšte ne igraju. Ono što je sigurno, jeste da ćemo u narednih par „sezona“ videti mnogo toga novog i uzbudljivog kada je grafika na računarima u pitanju. Ne može se reći da je NVIDIA u prethodnom periodu bila neuspešna, jer je bez žestokog ulaganja u R&D, uspela da povrati novac koji je uložen u razvoj GT200 i to na sasvim “desetoj” strani. Štaviše, prvi batch GF100 čipova će otići upravo u Tesla super-računare, koji su već poručeni od strane brojnih institucija (ako je verovati PR-u kompanije NVIDIA, naravno) i upravo zbog toga će GeForce GTX385 (ako se uopšte bude tako “zvao”), malo zakasniti na tržište. Jasno je da NVIDIA želi da što pre proda Tesla kartice, jer, kao što je danas u šali rekao pomenuti PR ove kompanije: prodati 1000 Tesla kartica je dobar posao, a prodati 1000 GeForce kartica sa istim čipom – nije ništa. Kartice kompaniju koštaju isto da se proizvedu, ali se GeForce GT200 prodaje za 200-ak evra, dok se „identični“ Tesla prodaje za dvanaest puta veću cifru!
No, vratimo se na kompaniju koja je danas predstavila novi mainstream Radeon akcelerator! Kao što znamo, Radeon HD4870 i HD4890 kartice su postale prilično jeftine u odnosu na ono koliko su koštale kad su se pojavile, a čip koji je nekada impresionirao brojkama (RV790) – 959 miliona tranzistora, 800 stream jedinica organizovanih u okviru 10 SIMD klastera, 40 teksturnih jedinica, 16 render back-end unit-a – postao je sasvim običan kada se pojavio Cypress. Korisnici, koji su pratili i posmatrali koliko je svaka nova generacija Radeon akceleatora donela u odnosu na prethodnu, sada očekuju da se sirova snaga, bar ona na papiru, udvostruči. AMD i ATI ih svakako nisu razočarali, pa je RV870 zaista veliki i moćan čip koji čini da RV770 i RV790 izgledaju kao običan mainstream. U AMD-u jesu naveli kako smatraju da kreiranje monolitnog čipa više nema smisla i da će njihov GPU uvek biti pozicioniran da bude „srce“ performance serije kartica, baš kao što su to bili RV670 i RV770. Dalja strategija je da se prvo kreira ultra-high end klasa sa CrossFire –on-board modelom (HD5870X2), a onda i da se od RV870 čipa, napravi jednako pametna, ali manje mišićava verzija GPU-a, baš kao što je to i ranije bio slučaj. Ova strategija nema razloga da ne upali i treći put, a trenutno smo u njenoj drugoj fazi. Ostaje samo da vidimo kako će „proći“ priča sa Radeon HD5870X2 modelom.
Iako ćemo na narednim stranicama pisati o drugom po redu AMD-ovom grafičkom čipu koji podržava DirectX 11, čitaoci kojima RV770 arhitektura nije poznata bi ipak trebalo da pogledaju neki od narednih testova na ovoj ili ovoj lokaciji. Osim gore preporučena dva testa, predlažemo da pogledate i naše prethodne testove Radeon HD4800 familije (dodatni link – 1, 2, 3), a posebno Radeon HD4870X2 akceleratora, u kome je cela priča o DirectX 10 generaciji GPU-ova dopunjena i osvežena. Da vas ne bi upućivali i na to da gledate prethodni test, mi ćemo priču o AMD-ovom prvom DirectX 11 grafičkom procesoru prebaciti u kraću formu, ali je i dopuniti i osvežiti novim informacijama. Čitaoci koji su baš sigurni da su naučili to gradivo, mogu odmah da preskoče stranu broj 2 i pređu na stranu 3…
Cypress tehnologija – još jednom!
Na ovoj stranici ćemo još jednom pomenuti sve novitete koje je doneo AMD-ov novi GPU, RV870, poznatiji kao Cypress, odnosno Radeon HD5800. Nakon ove, prilično dugačke html strane, prećićemo na razlike koje su karakteristične za Juniper – novi, manji GPU namenjen za Radeon HD5700 seriju kartica…
Kao što smo rekli, AMD je radio na unapređenju arhitekture, ali i sirove snage svog novog grafičkog procesora, ali je i on i dalje baziran na tradicionalnom tipu GPU „pipeline-a“, pa su tu ponovo streaming, render-back end iteksturne jedinice. Međutim, nas zanima kakve su novine vezane za unapređenje arhitekture i koliko je i kako poboljšan feature set i šta to konkretno znači za industriju i krajnjeg korisnika. Šta nam to novo donosi DirectX i DirectCompute 11, Shader Model 5.0, novi hardware tesselator i sistem senčenja, algoritam za kompresiju HDR slika,da li nam je potrebno da igre igramo u ultra-visokim rezolucijama na više monitora. Ono što znamo je da je AMD uspeo da udvostruči raw computing power u odnosu na prethodnu generaciju, ali da je zadržana 256-bitna memorijska magistrala. Svakako, broj RBE, TMU i stream jedinica je povećan, a ono što je novo je i podrška za rad na čak šest monitora na jednoj kartici. Ili na dvanaest, ako imate Crossfire, odnosno osamnaest ako imate Tripple CrossFire. Slobodno izračunajte šta bi bilo ako bi u sistem uspeli da „smestite“ četiri Radeon HD5870 akceleratora. Ruku na srce, za ovakve poduhvate će vam, osim mnogo prostora za monitore i šumu kablova iza, biti potrebna i Eyefinity verzija HD5870 kartice, ali o tome nešto kasnije.
RV870, Evergreen, grafički procesor sadrži oko 2.15 milijardi tranzistora. Setili smo se da smo tek nedavno bili fascinirani sa 956 miliona ovih osnovnih poluprovodničkih elemenata, koliko ih ima unutar Radeon HD4890 GPU-a (RV790). Sirova computing moć novog GPU-a, na Cypress karticama (Radeon HD5870) je više od 2.7 TeraFLOPS-a, a isto tako smo se, pre manje od godinu dana, oduševljavali što prethodna generacija uspeva da “prebaci” jedan TeraFLOPS. RV870 je prvi DirectX 11 GPU, prvi veliki grafički procesor izrađen u 40-nm, zbog čega je AMD uspeo da udvostruči efektivnu snagu procesora, a da ostane u istim okvirima potrošnje i zagrevanja kao kod prethodne generacije. Ovo im omogućava da ponovo primene Sweet Spot strategiju – nakon što se kreira GPU za performance segment, ultra-high end klasa kartica realizuje se sa Dual GPU modelom (HD5870X2), a onda se radi derivat postojećeg GPU-a sa manje streaming jedinica, te manjim TMU, RBE i cache blokovima – RV830 ili RV840 (koji će možda biti nazvani Radeon HD5700 ili HD5600). Iako je AMD naveo da više neće proizvoditi veliki monolitni GPU, kako nazvati procesor koji ima 2.15 milijardi tranzistora? Svakako, ovo nije toliko velik GPU, jer je izrađen u 40-nm procesu. S druge strane, njegova površina jeste veća od prethodnika, izrađenog u 65-nm litografiji. Izgleda da proces izrade ne može da napreduje toliko brzo kao apetiti i želje dizajnera GPU-a i tempa samog tržišta, a znamo da je potrebno ostati u vrhu.
RV870 se proizvodi u pogonima tajvanske kompanije TSMC u 40-nm procesu i, kao što smo naveli, sastoji se od približno 2.15 milijardi tranzistora, a njegova površina je 334 kvadratna milimetra, što nije mnogo, s obzirom na to da su RV770 i 55-nm G92 (G92b) negde oko 250-260 mm2, a znamo da su u pitanju GPU-ovi koji pripadaju performance, a ne high-end segmentu. Poređenja radi, GT200, koji ima 1.4 milijardu tranzistora, ima površinu od čak 576 mm2, dok se za GT200b smatra da je tek nešto ispod 500 kvadratnih milimetara.
Organizacija GPU-a
Front-end RV870 / Cypress čipa je prilično tradicionalan – AMD ga naziva Graphics Engine, što je bolje od našeg termina „pipeline“, koji je gotovo pogrešan, ali nam se uvukao u rečnik iz nekih prethodnih vremena. Sve kreće od Command Processor dela, koji je u samom komandnom vrhu, nakon čega slede standardne faze Graphics Engine-a koje možemo podeliti u Rasterizer, Hierarchical Z, Tesselator itd. baš kao i u prethodnim generacijama. Svaka od ovih jedinica je unapređena, sa akcentom na Tesselator, a Rasterizer i Hierarchical Z su toliko pojačani, da je AMD odlučio da ih dva puta prikaže na svom dijagramu. Štaviše, u zvaničnim dokumentima se i navodi da u GPU-u postoji dodatni Rasterizer kako bi se prvi rasteretio u situacijama u kojima bi veliki broj poligona mogao da zaguši ovu jedinicu dok radi na deljenju istih na teksele (koji će posle transformacije postati pikseli). Upošljavanje dodatne Rasterizer jedinice i adekvatan load balancing se vrši hardverski, unutar samog čipa i ne zavisi od komandi poslatih od strane drajvera. Osim Ultra Threaded Dispatch jedinice koju smo imali i u prethodnoj generaciji, GPU sada ima i Geometry Assembly Unit koji, između ostalog, može da adekvatno hrani computing jedinice i „pomaže“ Dispatch Unit-u u load balancing-u.
Tesselation je priča koju ATI pažljivo razvija još od Radeona 9700, koji je bio aktuelan pre više od sedam godina! Danas je ova mogućnost podržana i standardizovana od strane API-ja. Šira upotreba ove jedinice u igrama je krenula uz popularizaciju Xenos GPU-a unutar Xbox360 konzole. Unapređena Tesselator jedinica je je poseban deo RV870 grafičkog čipa koja obogaćuje low-poly 3D modele posebnim matematičkim algoritmima, u high-poly modele i to bez opterećenja na glavni computing deo GPU-a. Algoritam, preveden u hardver i dalje koristi usavršenu verziju matematičkog modela kakav je i ranije postojao, a koji se oslanja na higher-order surfaces princip, o kome smo baš na ovom sajtu pisali više puta, pre dve, pet i više godina (setimo se različitih metoda – N-Patches, Bezier patches, displacement maps). Uz DirectX 11, čitava priča je dobila na težini, jer se sada Tesselator jedinica koristi za programiranje putem dva tipa šejdera, a to su hull shaders i domain shaders. Algoritme koji se već koriste u DirectX 9 i 10 generaciji cross-platform igara kakve su one bazirane na Unreal 3 engine naslovima (Catmull Clark algoritam), Tesselator unutar RV870 jezgra može da odradi u jednom prolazu, iako ceo princip deljenja (tesselation) podrazumeva povećanje složenosti modela korak-po-korak. S obzirom da je algoritam kakav smo pomenuli multi-threadovan unutar modernog Radeon GPU-a, jasno je da se više koraka prilikom pripreme modela može podeliti na više sub-unit-a (koje su zapravo specijalizovane ALU jednice) unutar Tesselatora, tako da se ceo postupak odradi u jednom prolazu čak i za veliki broj modela. Ako su modeli unutar igre međusobno isti, Tesselator naravno može da sarađuje i sa Geometry Instancing sistemom, koji postoji i kod Cypress GPU-a, a koji je ATI prvi put predstavio na istom revolucionarnom GPU-u (R300, Radeon 9700). Geometry Instancing je podržan i kroz DirectX API još od verzije 9.0.
Valjalo bi napomenuti i da se nivo do kog će Tesselator usložnjavati modele može odrediti hardverski, unutar samog GPU-a, ali i kontrolisati od strane aplikacije, direktnim input-om na API, kako bi se kontrolisale performanse. Moćan Tesselator Unit će omogućiti da igre, bez bitnog učešća od strane dizajnera, imaju znatno detaljnije modele objekata, teren, pa i površine kakva je voda.
Još napredniji Shader
Ako pogledajmo sada osnovne karakteristike RV870 GPU-a.
Primetićemo da isti poseduje prilično veliki broj tranzistora – više od dva puta veći broj u odnosu na RV790, a pogotovo RV770 (koji ih ima još manje zbog nedostatka Decap Ring-a koji je omogućavao da RV790 postigne više radne učestanosti). Naravno, i broj shader, odnosno streaming procesor jedinica je udvostručen, ali i broj TMU i RBE unit-a. Svakako, memorijska magistrala je ostala ista, ali višak tranzistora je upotrebljen na dodatne, DirectX 11 specijalizovane jedinice, dodatne Rasterizer i Hierarchical Z jedinice, pojačani Tesselator… upravo zbog toga je RV870 toliko masivniji GPU. Osim udvostručenog broja computing jedinica unutar jednog GPU-a, AMD je i dodatno unapredio gotovo svaku od njih i to u domenu performansi po kloku, ali i preciznosti (što se najviše odnosi na stream processing jedinice). Neka od tih unapređenja su bila neophodna da bi se omogućila komplementarnost sa DirectX 11 API-jem u samom harderu, a neke je AMD uveo zbog performansi, uštede i bolje optimizacije i efikasnosti.
Pogledajmo pojednostavljeni grafički prikaz čipa. Po njemu bi se moglo reći da je RV770 samo dupliran, jer postoje dva bloka sa po deset SIMD jedinica, baš kao da je svaki taj veliki blok iz RV770 iskopiran na dva mesta u GPU-u. I naša priča o tome kako sada postoje dva Hierarchical Z i Rasterizer dela čipa govore u prilog toj “teoriji”. Dakle, Cypress ima 20 SIMD blokova, a u svakom se vidi po 16 thread processors unit-a i unutar svakog od nih pet aritmetičkih jedinica. Po AMD-ovom kalkulatoru, 20 x 16 x 5 = 1600, pa je tako navedeno da RV870 ima 1600 streaming processors jedinica. NVIDIA bi možda ovo objasnila drugačije – GPU ima 320 shader jedinica, ali je svaka od njih 5-way. U svakom slučaju, i dalje se radi o ALU jedinicama koje rade sa skalarnim operacijama, uz poseban translator koji vektorske instrukcije prevodi u nedimenzionalne, skalarne. Organizacija SIMD (Single Instruction Multiple Data) jedinica je, zapravo, jako slična organizaciji kod prethodnih generacija i u biti se nije promenila još od Radeona HD2900. Unutar svakog SIMD bloka postoji primarna izvršna jedinica superskalarnog tipa koja poseduje pet aritmetičko logičkih podjedinica (ALU-ova) sposobnih za po jednu MAD (multiply-add) instrukciju po ciklusu u 32-bitnom FP formatu. Od tih pet jedinica, jedna je zadužena i za transcendentne matematičke operacije (sin, cos, log, exp). Izvršne jedinice su povezane sa drugim takvim jedinicama unutar susednih SIMD-ova (uz osam obaveznih ciklusa kašnjenja, koji su „prepleteni“ pa je efektivna latencija svega četiri ciklusa). Ovde se ne misli na kašnjenje informacija koje SIMD-ovi dele, već o toku izvršavanja thread(ova) kroz streaming / shader deo GPU-a. Ako četiri ciklusa „latencije“ pomnožimo sa ALU „širinom“ svakog SIMD-a, dobićemo cifru od 64, što je upravo cifra o kojoj smo pričali kada smo objašnjavali arhitekturu Radeon HD2900XT akceleratora i koliko je bitno što je branching sada moguće podeliti na 64 piksela ili delova thread-a radi veće preciznosti i višeg „kvaliteta“ output-a.
Drugim rečima, SIMD jedinica je kontrolisana putem VLIW (very long instruction word) komande, koja može da obuhvati šest instukcija – pet matematičkih i jednu branching instrukciju. Ova komanda, VLIW kontroliše čitav SIMD blok ALU jedinica, koje rade na istom ili srodnom thread-u u datom trenutku. SIMD jedinice izvršavaju svaki thread paralelno i to na više elementarnih nivoa (5 matematičkih operacija uz obavezan flow control. Unutar svakog shader programa postoji specijalna instrukcija koja kontroliše, odnosno opisuje kako bi kod trebalo da se izvrši pod određenim (važećim) uslovima. Niz ovih instrukcija kroz nekoliko povezanih ili jedan (veći) shader program se zajedno nazivaju – flow control. Zahvaljujući preciznom Dispatch Processoru i već pomenutim arbitrima, sve operacije unutar jednog thread-a se izvršavaju paralelno kroz celu SIMD jedinicu, uz napomenu da se Texture i Vertex Fetch operacije prosleđuju i izvršavaju odvojeno.
Iako smo ovaj deo teksta mogli gotovo da prekopiramo iz dve i po godine starog teksta o Radeon HD2900XT akceleratoru, neke stvari su kod RV870 značajno unapređene, ali ih je veoma teško opisati rečima, a mi ne želimo da prenosimo matematičke formule i primere koda koje bi uskom delu čitalaca mogle da objasne kakva su poboljšanja postignuta na GPU compute nivou, a sve zbog povećanja efikasnosti ALU jedinica uopšte, ali i u radu sa tipskim shader programima. AMD navodi da je instrukcioni set DirectX 11, DirectCompute 11 i OpenCL-a praktično potpuno implementiran u hardveru RV870 čipa. Ono što je konkretno poboljšano unutar svakog od SIMD blokova, a da je lako preneti “na papir” je i lokalna short-term bafer memorija koja se koristi za internu komunikaciju, a koja je sada duplirana i iznosi 32KB, a memory export buffer je povećan na 64KB, što znači da je dva puta efikasniji od istog kod RV770 (prosleđuje i do 64 32-bitne obrađene paket-instrukcije po kloku). Uostalom, u tabeli ste već mogli da vidite da je maksimalna processing moć RV870 GPU-a na Radeon HD5870 kartici čitavih 2.7 TeraFLOPS-a što je dva puta više od onog što nudi GeForce GTX 285 akcelerator. Ono što je još specifično za RV870 je da su kod ovog GPU-a prvi put izostavljene tradicionalne jedinice za interpolaciju unutar setup engine-a, čiju funkcionalnost sada preuzima shader procesor. Naime, ove funkcije su sada objedinjene unutar DirectX 11 kao jedan od njegovih feature-a i nazivaju se pull-model interpolation. Osim uštede u “tranzistorima”, ovaj deo sada i nema fiksnu funkciju i prilično je programabilan, što omogućava veću kontrolu nad funkcijama interpolacije tj. prikaza 3D površina sve do nivoa kontrole prikaza tekstura i filtriranja istih! Pored toga, interpolacija unutar posebne jedinice je u nekim situacijama postajala korak koji je usporavao i bio usko grlo u pripremi scene, a novi programabilni pull-model koji se oslanja na shader sada je dosta bolje izbalansiran (više se koristi u teksturno intenzivnim scenama koje imaju manje vertex operacija, odnosno manje u scenama sa manje tekstura i više “geometrije”), a s obzirom na daleko veću computing moć shader dela GPU-a, jasno je da će i na ovom polju, RV870 biti, klok za klok, efikasniji od prethodne generacije.
Radeon HD5870, Cypress GPU podržava i jednu instrukciju u svom hardveru, koju trenutno ne koristi ni DirectX 11, a ni OpenCL, ali može biti vrlo korisna u komunikaciji na nivou kompajlera i prevodioca, ako se dobro implementira u drajverima. U pitanju je SAD instrukcija (Sum of Absolute Differences), koja bi mogla da se koristi pri enkodingu video sadržaja i rada sa sličnim setom instrukcija tj. susednim setovima thread-ova koji se međusobno malo razlikuju (a takvi su vrlo česti). Prilikom enkodovanja HD videa, RV770 emulira SAD instrukciju putem deset do petnaest posebnih instrukcija, koje se ponavljaju u svakom sledećem koraku. Hardverski implementirana SAD instrukcija znači da se ona može obaviti u jednom klok ciklusu, što može da omogući i enkoding video materijala rezolucije četiri puta veće od FullHD-a, samo kad se implementira unutar drajvera. SAD se, kao što smo naveli, može iskoristiti kao zamena za različite tipske instrukcije prilikom rada sa kompajlerom, pa je moguće da ćemo videti značajnija ubrzanja kroz drajvere u narednim mesecima.
TMU i memorijski kontroler
Toliko povećanje SIMD, odnosno shader computing dela učinilo je da pristup memoriji kakav je bio prisutan od RV670, mora da se promeni. Količina L1 keš memorije sada iznosi 160KB (8KB po SIMD-u), uz više od 1TB/s propusnog opsega koje su na raspolaganju za L1 texture fetching, ačetiri zasebne L2 keš stanice, sada svaka sa 128, umesto 64 KB (sa bandwidth-om od 435 GB/s prema L1), nalaze se na svakom od memorijskih kontrolera pri render back-end-u. RV870 i dalje ima četiri 64-bitna memorijska kontrolera, što ukupno daje 256 bita za put ka video memoriji i to je jedini deo GPU-a koji je u odnosu na prethodnika nepromenjen. Propusni opseg je, doduše, u odnosu na Radeon HD4870 povećan za oko 40% (sa 3.6 GB/s na 4.8 GB/s), ali bi voleli da se AMD ipak odlučio za 128 bita širu magistralu, jer je ostatak GPU-a “pojačan” u svakom smislu za 100%, pa je moguće da će u visokim rezolucijama upravo širina memorijske magistrale predstavljati, bar u nekoj meri, usko grlo. Nismo sigurni da će se u skorije vreme pojaviti drastično brži GDDR5 čipovi koji bi mogli efektivan bandwidth da povećaju za 100% u odnosu na prethodnu generaciju, ali AMD je smatrao da bi bilo isuviše skupo ići na proširenje širine memorijskog kontrolera najpre jer bi to dodatno zakomplikovalo sam PCB. To bi, kao rezultat, verovatno onemogućilo da najbrža izdanja sa ovim čipom koštaju manje od 350 dolara, a verovatno bi se stvorio problem i sa “X2” varijantom koja je kod ATI-ja uvek bila Single PCB solucija, a koja bi u tom slučaju bila previše dugačka za smeštanje u obična kućišta. S druge strane, AMD tvrdi da je napravljen još jedan korak u daljoj optimizaciji potrošnje resursa koji GPU ima prema memorijskom podsistemu.
Osim algoritama koji su i ranije bili prisutni, sada je tu i block texture compression mod koji je AMD osmislio i predložio da bude uključen u DirectX 11 specifikaciju. Ovaj algoritam podrazumeva efikasniju kompresiju, brži rad i viši kvalitet nakon rekompresije u odnosu na prethodna rešenja (bolji rad sa alfa-kanalima, transparentnim i FP16 HDR slikama, bolji signal-to-noise odnos, itd.), pa je sada moguća kompresija i u odnosu od 6 : 1 i to za teksture koje su prilično velike (čak 16.000 x 16.000 piksela).
Osim sistema za kompresiju, AMD je dodatno poradio na kvalitetu anizotropnog filtriranja, što nije bilo toliko komplikovano kao što izgleda, s obzirom na to da smo već pomenuli kako je ova specijalizovana jedinica sada izbačena iz GPU-a i dodeljena, kao programabilna funkcija, u sam compute-shader deo GPU-a (streaming jedinice). AMD tvrdi da je novi algoritam jednako dobar kao referentni, emulirani Direct3D rasterizer, ali, naravno, neuporedivo efikasniji, jer nije ništa sporiji u odnosu na rešenje iz prethodne generacije. U ovom trenutku, dakle, AMD poseduje rešenje koje je bolje od konkurentskog, čak i kada se u ForceWare drajverima primeni high quality filtering. Čak i za običan trilinear filtering mod, AMD sada primenjuje full -true trilinear bez primene blending-a koji je uvek bio uključen, kako bi se aproksimacija prethodnih, manje preciznih (tzv. adaptive trilinear) metoda, koje su se koristile radi boljih performansi, manje videla u igrama. Kako se sada ova operacija obavlja unutar shader jedinica, AMD je odlučio da poveća kvalitet prikaza i na tome im skidamo kapu. Zadržavanje adaptive trilinear metoda bi možda dodatno povećalo performanse (i dalje ga je moguće aktivirati u drajverima), ali je podrazumevano (default) podešavanje – full trilinear.
Render Back End, Tesselator, Display Controler, PowerPlay…
Jedinica koja se nalazi “na kraju” rendering endžina, popularni ROP (raster operator) ili render back-end je takođe doživeo dosta poboljšanja. Osim što je dvostruko veći, pa ima 32 jedinice, svaka od njih sada ima i nove mogućnosti. Poseban deo je dodat za poboljšan rad sa custom-filtered AA sempl modovima umekšavanja ivica na objektima, jer omogućava teksturnim jedinicama da direktno pristupaju i čitaju podatke iz specijalizovanih bafer memorija koji sadrže informacije o bojama piksela na objektima na kojima se izvršava antialiasing. Pored standardnog multisampling AA algoritma i već poznatog, novog custom sample AA metoda, AMD se ponovo vratio supersampling antialiasing-u. Podsećanja radi, supersampling je najzahtevniji metod umekšavanja ivica koji praktično renderuje čitavu scenu u većoj rezoluciji, a onda je skalira u rezoluciju u kojoj se ona prikazuje (jedini pravi FSAA u pravom smislu te reči), dok se multisampling samo fokusira na ivice objekata. Supersampling i dalje daje najbolje rezultate, pa se uvek koristi kod offline render sistema, ali se manje koristi u realtime grafici zbog svoje neefikasnosti. Naravno, custom sample antialiasing metodi su zadržani kao neka vrsta trademark-a i najboljeg odnosa performansi i kvaliteta, baš kao što je slučaj i sa coverage sample antialiasing algoritmima kod GeForce kartica.
I rad sa multiple render target-ima (MRT) je poboljšan, jer je AMD uveo još efikasniji sistem za brzo pražnjenje pomenutog bafera, kako bi bio spreman za sledeći ciklus. Prethodno pomenute L2 keš memorije, koje su ovoga puta dvostruko veće i četiri puta efikasnije u odnosu na iste u prethodnoj generaciji bi trebalo da smanje pad performansi kada se koristi viši nivo multisampling antialiasing-a (8x u odnosu na 4x), ali će u svakom slučaju pomoći da se izbalansira nešto niži memorijski bandwidth (od očekivanog)koji je možda i jedini slabiji deo ovako moćnog GPU-a.
Kontroler koji omogućava prikaz slike na ekranu je potpuno redizajniran da se može reći da je ponovo kreiran – od nule. Naime, on sada podržava sve tipove video konekcija, od D-Sub-a, preko DVI-I i HDMI konekcije, pa sve do Display Port-a. Osim toga, novi display controller nudi mogućnost prikaza do čak šest video stream-ova uz preciznost od 10-bita po komponenti (boji). Ovaj programabilni deo GPU-a je tako i u mogućnosti da prikaže jedan “ekran” u fantastičnoj rezoluciji od 5760 x 2160 piksela. Štaviše, u ovoj rezoluciji se možete i igrati, mada sumnjamo da je i Radeon HD5870 dovoljan za igranje novijih igara u ovom modu (a za šta, uostalom, upotrebiti dve Radeon HD5870X2 u Crossfire modu? – prim.aut.). Kako prikazati ovu rezoluciju, pitate se? Svakako, uz više monitora, što vam omogućava ATI Eyefinity, ali o tome nešto kasnije u tekstu.
S obzirom na to da je, kako ćemo videti u sledećem pasusu, rad sa VRAM-om dodatno optimizovan tako da sada i GDDR5 čipovi imaju mogućnost rada na znatno nižim naponima (u 2D i intermediate režimu), Radeon HD5870, dok prikazuje desktop, troši svega 27W struje, što je fantastičan podatak. Maksimalna potrošnja ovako snažne kartice i nije preterano velika i iznosi svega 188W. Podsetićemo da je GeForce GTX285 u stanju da povuče preko 210W, a overklokovana izdanja GeForce GTX280 i blizu 250W, što je zaista mnogo za SingleGPU akcelerator!
Memorijski kontroler i VRAM
Kao što smo već pomenuli, memorijski kontroler se sastoji od četiri manja kontrolera širine 64 bita, baš kao što je slučaj i sa RV790, RV770 i RV670. Cypress koristi GDDR5 tip memorije, a ovo je četvrta generacija Radeon kartica (ako se Radeon HD4890 može nazvati novim modelom, u odnosu na HD4870 samo jer koristi malo dorađeni GPU). Svakako, Radeon HD5870 ima nešto manji maksimalni memorijski propusni opseg od najjačeg SingleGPU konkurenta prethodne generacije (GeForce GTX285), što je rezultat 256-bitnog memorijskog kontrolera, kakav ima i Radeon HD4890. Kako onda možemo računati na to da će RV870 uspeti da nadmaši DualGPU soluciju prethodne generacije? AMD je definitivno odustao od ring-bus sistema memorijskog kontrolera i vratio se onom koji po organizaciji više podseća na klasičan crossbar tip. Međutim, novi memorijski kontroler je dodatno optimizovan za rad sa ultra brzom GDDR5 memorijom. Osim većih bafera o kojima smo već pisali, a koji se nalaze “između” render back-end dela i memorijskog kontrolera, više frekvencije su postignute uvođenjem EDC sistema (Error Detection Codes) i kompenzacijom temperature. EDC je zapravo CRC check na svakom od transfera podataka, dok nam za Memory Clock Temperature Compensation nije baš najjasnije kako funkcioniše, jer nam sam naziv ove funkcije nije previše logičan, a više podataka o ovom sistemu nismo našli u priloženim dokumentima. Treća dodatna funkcija je i mogućnost promene radne frekvencije memorije i njenog napona, pri promeni aktivnog stanja čitavog akceleratora (ovo je i ranije bilo moguće, ali je radni napon memorije uvek ostajao isti). To je konačno omogućilo da Radeon HD5870 akcelerator troši izuzetno malo u stanju mirovanja, što je izuzetno bitna stavka.
Uz EDC i “kompenzaciju temperature” je omogućen još veći efektivan “klok” VRAM-a, koji sada bez problema ide od 5 GHz (1250 MHz, realno). Svakako, memorijski propusni opseg je povećan, a PCB nije dodatno zakomplikovan. Ipak, bandwidth i nije mnogo veći, jer je i Radeon HD4890 imao impresivne VRAM performanse. S obzirom na to da je computing deo GPU-a pojačan duplo, a memorijski podsistem za tridesetak procenata, sasvim je moguće da će Cypress arhitektura, u ekstremnim rezolucijama tek pokazati šta može kada se pojavi GDDR5 koji efektivno radi na 7-8 GHz.
Još jedna novina, kojom zaključujemo “hardverski” deo priče (bar dok se ne posvetimo opisu same Radeon HD5870 kartice), vezana je za činjenicu da ova kartica ima mogućnost samo-regulacije naponske jedinice. Naime, regulatori napona mogu GPU-u obezbediti tačno onaj napon koji mu vi zadate (putem soft-mod-a u bios mod aplikaciji), a isto važi i za regulator napona video memorije.
DirectX 11, konačno
DirectX 10 nije bio toliko prihvaćen od strane programera koji razvijaju zabavni softver. Iako je, bar na papiru, delovao kao prilično veliki i važan korak u odnosu na DirectX 9. Pa ipak, za to je velikim delom kriv i Microsoft, koji je želeo da se Windows Vista proda u što većoj meri, iako to realno nikako nije “zaslužila”, pa je DX10 bio ekskluzivnost ovog OS-a. Windows 7, koji je značajno bolji operativni sistem, nije ekskluzivan za DirectX 11, koji će radit i na Windows Vista OS-u, ali će, u to smo ubeđeni, biti prihvaćen znatno brže od strane krajnjih korisnika, nego što je to bila Vista. DirectX 11 je prilično važan korak u napretku ovog API-ja i, mada smo tako nešto već rekli za prethodni, smatramo da je DX11 bitan jer će biti prihvaćeniji od svog prethodnika, a samim tim će i postati “ono što je DX10 trebalo da bude”. U tom smislu je itekako bitan i to ne tvrdimo samo zato što donosi dosta poboljšanja u odnosu na prethodnika. Uostalom, doneo je i DirectX 10 u odnosu na “devetku” pa ga je dobar deo game developer komune praktično ignorisao.
Kao i ranije, novi API donosi nešto od čega će koristi imati i programeri, ali i krajnji korisnici. Izvršavanje kompleksnih šejder programa, koji su bili praktično izbegavani ili aproksimirani do sada će biti znatno ubrzano, a neke od novih funkcija su tek sada i realno moguće, bez drastičnog pada performansi koji bi bio iminentan kada bi bio realizovan kroz DirectX 10. DirectX 11 donosi Hull, Domain i Compute Shaders, a dalje poboljšava, ubrzava i proširuje rad sa Geometry, Pixel i Vertex Shaderima. Unutar Compute Shaders sistema sada je i DirectCompute 11, koji omogućava da sam OS ili aplikacija ima direktan pristup GPU-u, što je slično principu kojim se OpenGL „rukovodi“ od svog nastanka. O DirectCompute 11 sistemu ćemo više reći nešto kasnije. Dakle, DirectX 11 nam donosi DirectCompute 11 (ubrzanje general purpose aplikacija, ali API koji obezbeđuje ubrzanje fizike i kalkulaciju veštačke inteligencije putem GPU-a), zatim Shader Model 5.0, naprednije senčenje, kompresiju HDR tekstura, standardizuje Hardware Tesselation i multi-threading.
DirectCompute 11, Multi Threading, Tesselation, HDR texture compression
Oslanjanjem na DirectX 11 DirectCompute, programer aplikacije namenjene Vista i Windows 7 operativnom sistemu sada može da iskoristi enormnu količinu processing moći GPU-a za ubrzanje praktično bilo koje vrste koda. Najviše, pak, ima smisla kompajlirati aplikaciju koja radi na obradi velike količine podataka odnosno aplikacije koje imaju veliki throughput, poput aplikacija za transkoding video materijala, rendering ili rad sa složenim filterima na velikim fotografijama. Takve aplikacije se lako mogu multi-threadovati, jer se velika količina podataka za obradu može podeliti u „niti“ koje bi se paralelno izvršavale kroz ogroman broj SIMD jedinica, odnosno stream-shader procesora unutar GPU-a. Takva vrsta obrade podataka se naziva Stream Computing. DirectCompute 11 omogućava čist, jednostavan i direktan pristup resursima grafičkog procesora, koji se, kao što vidimo, danas može iskoristiti i za ubrzanje aplikacija koje nemaju veze sa igranjem. U budućnosti će general purpose stream computing postati vrlo rasprostranjen, pa jednog dana više nećemo biti sigurni koje taskove obavlja grafički, a koje centralni procesor.
Pošto su i igre aplikacije, svakako da je moguće i njih pisati za DirectCompute 11, mada bi to zahtevalo prilično radikalne promene unutar razvojnih timova koji su već navikli na Direct3D ili OpenGL, ali je dobro što je DirectCompute 11 standard deo DirectX 11 API-ja i kao takav omogućava da se deo aplikacije, jedan njen feature obavlja putem “direktnog pristupa GPU-u”. Tako, recimo, programeri mogu da kreiraju engine čiji će filtering tekstura biti obavljan putem DirectCompute 11 sistema, ako se pokaže da takav način obezbeđuje bolje performanse. Ili, ako igra poseduje veliki broj post-processing efekata, kakvi su depth of field ili object motion blur, koji bi opteretili engine, isti se mogu prebaciti na DirectCompute 11, gde će ih streaming jedinice “samleti” bez uplitanja više posrednika (engine (koji se rasterećuje bar dela “obaveze”), drajver,kompajler , API…). U ovom slučaju GPU se ponaša više kao CPU koji obavlja deo grafičkih kalkulacija u krajnje netradicionalnom maniru, što je, u neku ruku slično programiranju za PlayStation 3 platformu, na kojoj se “grafički procesor” koristi uglavnom za scenski (triangle) setup i “lepljenje” tekstura, dok sav post-processing obavlja moćni Cell procesor. Bar je takav slučaj sa timovima koji prave ekskluzivne naslove za ovu platformu, koje obično izgledaju za dve klase bolje od multi-platformskih igara.
Naravno, pisanje čitave igre za DirectCompute 11 ne bi rezultovalo boljim performansama, jer bi se kompletna priprema 3D scene, ali i izvršavanje ostatka komponenti koja čini jednu igru (fizika, AI, zvuk, input), prebacio isključivo na streaming jedinicu, što nema mnogo smisla ako znamo da GPU već ima nešto specijalizovanije celine za efikasan rad sa grafikom. Ipak, prebacivanje kalkulacija veštačke inteligencije i fizike na DirectCompute 11 je nešto što ćemo sigurno videti u bliskoj budućnosti. DirectCompute 11 će omogućiti i implementaciju drugačijih vrsta game engine-a, kakve su se ranije izvršavale na centralnom procesoru (voxel tip prikaza realtime grafike) ili nečega što u igrama još uvek nije viđano, bar ne van tehnoloških demoa, a to je Ray Tracing.
AMD je već prikazao i demo koji pokazuje konkretnu primenu DirectCompute 11 sistema, koja se zove Order Independent Transparency, a koja prikazuje kompleksan model robota (kao iz igre Mech Warrior) unutar koga se vide i unutrašnji delovi, kao na nekom moćnom rentgenu. Razlika između ove vrste transparentnosti i tradicionalne je veoma velika, jer se vide samo delovi objekta koji bi se videli i u realnosti (sastav iste gustine zaklanja sebe samog i manje guste delove iza, dok manje gusti delovi ne zaklanjaju unutrašnjost). Malo je teže za objasniti, ali pokušajte da pažljivo pogledate sliku, pa će vam biti jasnije. Pomoću OIT metoda se realističnije može prikazati dim, vatra, trava, kosa, ograde i druge slične površine i objekti bez nuspojava koje su poznate svakom današnjem igraču.
GPU
DirectX 11 Feature
DX10
DX 10.1
DX 11
Tesselation
Ne
Ne
Da
Shader Model 5.0
Ne
Ne
Da
DirectCompute 11
Ne
Ne
Da
DirectCompute 10.1
Ne
Da
Da
DirectCompute 10
Da
Da
Da
Multi-threading
Da
Da
Da
HDR Texture compression
Ne
Ne
Da
Multi-threading je način obrade paketa informacija, odnosno koda, koji grafičkom procesoru najviše prija. Implementacija multi-threading-a unutar DirectX 11 API-ja omogućava “serviranje” baš ovako spremljenog koda, koji se tokom obrade u GPU-u naziva multi-threaded rendering.
Shader Model u verziji 5.0 je High Level Shader Language (HLSL) koji pruža još dodatnih i novih načina za implementaciju shader programa. U odnosu na prethodnu verziju donosi podršku za double-precission, odnosno podršku za još duže i kompleksnije shadere.Kao što smo već napomenuli, hardverski tesselator prisutan i u RV870 GPU-u, koji ATI razvija još od 2001. godine, a koji je u praksi najviše korišten unutar Xenos GPU-a kod Xbox 360 konzole, sada je podržan i od strane DirectX 11 API-ja. Dalje usložnjavanje objekata putem sub-division algoritama je moguće izvesti na više načina, ali su u DirectX 11 API-ju podržani već pominjani Hull Shader i Domain Shader algoritmi. Jasno je da Tesselator samo može da učini da uglastiji objekat postane obliji, što će biti od pomoći na nekim objektima i terenima, ali ne može da kreira neke suptilne detalje na objektu, koje sam dizajner nije predvideo na njemu. Zato je za postizanje finih detalja na objektima i dalje neophodno koristiti displacement mape, kakve su bump teksture ili occlusion mape, koje se mogu koristiti i u sprezi sa transparentnim detailed mapama koje dodaju detalje na objektima sa baznom kolor teksturom bez potrebe da ista bude u ultra-visokoj rezoluciji. I za kraj ćemo navesti i da DirectX 11 podržava novu tehniku za kompresiju HDR tekstura, koje se dele na dva metoda – BC6 i BC7. Block Compression 6 podrazumeva kompresiju HDR podataka u odnosu od 6 : 1 uz zadržan visok kvalitet (male gubitke) i prilično dobre performanse. BC7 se koristi za kompresiju 8-bitnih low-dynamic range slika u odnosu 3 : 1.
A igre…
S obzirom na to da je DirectX 10 već duže vreme prisutan, a nije baš previše rasprostranjen (većina igara se i dalje uglavnom oslanja na DirectX 9), postavlja se logično pitanje kada će programeri da počnu da koriste sledeću generaciju ovog API-ja. Iako je DirectX 10 za mnoge bio “odbojan”, tu je i činjenica da se dosta naslova razvijalo za Xbox 360, pa bi podrška za DX10 samo dodatno oduzela vreme i nepotrebno produžila time to market. Situacija je drugačija sa DirectX 11 generacijom i ova verzija API-ja će, po svemu sudeći, biti daleko brže prihvaćena. Neki naslovi su se već pojavili na tržištu, dok se neki očekuju do kraja godine. Među njima je svakako i real-time strategija BattleForge koju izdaje Electronic Arts i koja je prvi DirectX 11 naslov koji se pojavio na tržištu. Jedna od naprednih funkcija koju ova igra podržava kada se pokrene u DX11 modu je i High Definition Ambient Occlusion, koji omogućava podizanje realističnosti scene krajnje efektivnim načinom senčenja. Šteta što je igra samo fantasy RTS – neki foto-realistični demo ili igra bi daleko bolje ilustrovali koliko zapravo donosi HDAO.
Uskoro će se na tržištu naći i englesko izdanje ruskog naslova S.T.A.L.K.E.R: Call of Pripyat, FPS RPG igre koja takođe podržava DX11, ali i izgleda prilično dobro. Ono što smo mogli da vidimo na screenshot-ovima je, za sada, podrška za napredne senke koje su oštrije kada su bliže objektu i sve mekše kako su dalje od njega. Colin McRae DIRT 2 je nedavno izašao u verziji za Xbox 360 i PlayStation 3, ali će u izdanju za PC podržavati i DirectX 11, što znači da će posedovati unapređene efekte na vodenim površinama (koristi se tesselator), bolje i detaljnije modele, detaljnije senke i druge novine (za sada se ne zna dokle će programeri ići sa implementacijom DX11 mogućnosti ali igra za sada ne izgleda bitno drugačije od verzije za Xbox 360).
Svakako najviše iščekivan naslov je i Aliens Vs. Predator od Rebellion Games-a, tima koji je kreirao prvu AVP igru. Ako je sudeći po screenshotovima, igra zaista ima potencijala kada je prezentacija u pitanju. Osim High Definition Ambien Occlusion-a, podržavaće i Hardware Tesselation, što znači da će Alien i Predator izgledati strašnije nego ikada. Nažalost, igra će se pojaviti tek na proleće naredne godine.
Universal Video Decoder 2.0
Prva generacija AMD Unified Video Decoding engine-a je već bila dovoljno usavršena i o njoj smo više puta pisali. NVIDIA grafičkih procesori od G84 na ovamo, kao i nova familija Radeon HD2000 (bez 2900XT i Pro modela) i HD3000 akceleratora imaju posvećeni video processing engine koji ATI naziva Unified Video Decoder. U odnosu na AVIVO, UVD je napredovao koliko i PureVideo HD druge generacije u odnosu na rešenje iz GeForce 7 familije, a nakon njegovog izostanka ili nefunkcionalnosti kod R600 kartica, našao je svoje mesto kod aktuelne HD3800 serije. AMD tvrdi da je smanjenje CPU utilizacije pri posmatranju H.264, a posebno VC-1 video formata, koji su postali standardni video kodeci za BluRay naslove zaista vredno pažnje, čak i na desktop sistemima. Prilikom obrade HD video signala, pred grafičkom karticom stoji izazov koji se ne završava samo na procesiranju bar 6x više informacija u odnosu na video signal standardne definicije. Jednostavno rečeno, grafičke kartice poseduju specijalnu logiku koja im objašnjava kako da brojne shader jedinice iskoriste za obradu video signala. Pošto su GPU-ovi sve moćniji, zbog čega stati na 1080p rezoluciji? AMD je proširio podršku i za XHD rezolucije, što nam nije teško da zamislimo jer, ako ove kartice bez problema rade sa stotinama tekstura visoke rezolucije koje “lepe” na hiljade poligona u 3D igrama, zbog čega ne bi mogle da, tridesetak puta u sekundi, nalepe jednu “teksturu” na jednu površinu na ekranu. Naravno, jasno je da se na tu “teksturu” primenjuju malo zahtevniji algoritmi od običnog trilinear ili anisotropic filtera, brinuti o daljem toku podataka, korekciji i kompenzaciji pokreta, de-interlacing-u i tome slično, ali je sve to, složićete se, i dalje manje kompleksan “shader program” od “sličnih” rutina u modernim igrama.
Početne BitStream i Entropy Decode faze se sada izvršavaju od strane GPU-a. UVD je kreiran da u potpunosti dekodira i najzahtevnije (i najnaprednije) video kodeke kakvi su VC-1 i H.264, uključujući i bitrate od 40 Mbps ili više i koristi već postojeća, programabilna SIMD jezgra, odnosno Stream Processors jedinice. Ono što novi Radeon HD4800 GPU-ovi podržavaju, a od nedavno i konkurencija sa novim GPU-ovima, naziva se full-speed CABAC i CAVLC dekodiranje u okviru H.264 i VC-1 kodeka. Sav postprocessing se obavlja unutar shader jedinica, uz primenu filtera koji su ništa drugo do namenski kreirani shader programi koji se u potpunosti izvršavaju in hardware. HDMI, odnosno High Definition Multimedia Interface je u potpunosti podržan od strane RV670 GPU-a, zajedno sa obaveznim HDCP (High-bandwidth Digital Copy Protection) sistemom zaštite od kopiranja. Osim digitalnog signala, HDMI konektor “prenosi” i više kanalni audio zvuk, koji RV770, kao i RV790 i RV870 podržavaju. Novina kod Cypress GPU-a je i hardverski upscale 1080p filmova u rezoluciju 2650 x 1600 piksela, što zaista izgleda impresivno. Novine UVD 2.1 (da ga tako nazovemo) endžina su sledeće:
• Hardware acceleration dekoding za dva 1080P HD stream-a
• Kompatibilnost sa Windows Aero modom – reprodukcija HD video klipova uz aktivan Aero Glass mod na desktopu
• Video gamma – gamma kontrola je nezavisna od iste koja važi za Windows desktop
• Brighter whites – Blue Stretch procesiranje povećava vrednost svetlijih tonova za dinamičniji prikaz videa
• Dynamic Video Range – bolja dinamička kontrola tamnih tonova i crne tokom reprodukcije
Dodate su i funkcije Dynamic Contrast Enchancement i Dynamic Color Enchancement za koje već iz samog naziva možete da predpostavite koju ulogu imaju. Kod prethodne generacije UVD-a smo imali podršku za maksimalno 5.1, 16-bit PCM Stereo ili kompresovani AC3 5.1 više kanalni audio-stream po Dolby Digital i Dolby DTS standardima, ali je to kod RV770 i novijih čipova sve dovedeno na viši nivo – sada je podržan osmokanalni (7.1) audio uz maksimalan bitrate od 6.144 Mbps i sempling od 192KHz i 24-bita. Podrška za “filmske” formate se ne zaustavlja na Dolby DTS i Digital standardima – tu su sada i True-HD i DTS HD formati u koje se slažu zvučne slike na novim BluRay izdanjima.
Još jedna od bitnih novina je i mogućnost dual-stream plejebeka, pa RV870 može da pusti dva HD video feed-a i to u modu “slika-u-slici” sa kompletnim de-kodiranjem kroz VC-1, H.264 i MPEG-2 (uz upscaling DVD formata u HD rezolucije i nove profile sa dinamičkim kontrastom). AMD će uskoro na websajt pustiti i novu aplikaciju Accelerated Video Transcoding koja će omogućiti transkoding HD video formata u MPEG-2 ili H.264 i to oko 19 puta brže nego Intel Core 2 Duo E8500 CPU (mereno za klip u 1080p rezoluciji). Ovaj algoritam će se pojaviti i u obliku plug-in-a za Cyberlink's PowerDirector aplikaciju, a ubrzo i druge popularne programe.
ATI Eyefinity
Na prvih nekoliko strana smo pominjali i mogućnost Radeon HD5870 akceleratora da prikaže sliku na čak šest monitora. Svakako, za tako nešto vam je potrebno specijalno izdanje koje se naziva Radeon HD5870 Eyefinity6 Edition – kartica koja ima šest video konektora. Međutim, čak i sa običnim izdanjem je moguće povezati do tri monitora od 30 inča i objediniti ih u jedan desktop rezolucije od 7680 x 1600 piksela i igrati igru u ovom monstruoznom grafičkom režimu. Eyefinity6 edicija ove kartice, tako, može da pruži fantastičnih 5760 x 2160 piksela (ako se upotrebi svih šest displeja, maksimalna rezolucija za svaki od njih se spušta na 1920 x 1080 piksela), u kojima možete igrati Crysis, Flight Simulator, Dirt 2, Need For Speed Shift ili skoro bilo koju aktuelnu igru koja vam padne na pamet. Naravno, za solidne performanse u tako monstruoznim grafičkim modovima će biti neophodno i da dodatno osnažite grafički podsistem sa još jednom, dve ili tri Radeon HD5870 kartice, ali ako baš imate viška para, prostora i sebe smatrate ultimativnim igračem, dobro je znati da je i ovako nešto moguće. Štaviše, u CrossFire X varijantama je moguće povezati čak i 24 monitora, što će se retko viđati i na sajmovima, ali je sjajna demonstracija sile!
Pogledajmo sada kako to izgleda u praksi – za sada, bar na slikama. Iskreno rečeno, nama sve to izgleda impresivno, ali nam prilično smetaju okviri ekrana koji kvare zadovoljstvo i to u velikoj meri. Jedva čekamo da se neko doseti da kreira rešenje koje će imati spojene displeje bez ikakvih ivica. Smatramo da je tako nešto sasvim izvodljivo. Daleko je impresivnija podrška za ATI Stream, iako je u medijima znatno manje obrađivana. ATI Stream je zapravo pandan NVIDIA CUDA sistemu, ali je potpuno otvoren standard. Ipak, iako postoji godinu dana, sada se pitamo koliko će se dalje razvijati, s obzirom na to da je sada dostupan daleko konkretniji – DirectCompute 11.
Juniper – sličnosti i razlike
Kao što možete da predpostavite, Juniper je baziran na istoj arhitekturi kao i Cypress, pa sa njim deli i iste mogućnosti, odnosno feature set. Zbog toga i jesmo čitavu priču o toj arhitekturi ponovili na prethodnoj strani. Radeon HD5700 GPU je takođe proizveden u 40-nanometarskom procesu, baš kao i pripadnik prethodne generacije, RV770 – Radeon HD4770, koji je i jedini čip iz prethodne, DirectX 10.1 serije, koji je izrađen u ovom procesu, a istovremeno je i prvi GPU sa kojim se AMD “prebacio” na sitniju litografiju. Juniper se sastoji od oko 1.04 milijarde tranzistora, što je više od 50% manje u odnosu na 2.15 miliona ovih osnovnih poluprovodničkih elemenata, koliko ih ima kod Cypress jezgra. Istovremeno, ova cifra je i nešto veća od 956 miliona tranzistora kod RV770 GPU-a (Radeon HD4890), koji je izrađen u 55-nm procesu. Svakako, usvajanje novijeg Shader Modela i dodatne optimizacije na nivou keš memorije i SIMD jedinica su učinile da GPU koji ima sličnu “snagu”, bude, mereno sirovim brojem tranzistora, nešto kompleksniji, bez obzira na to što čak ima i dva puta manji broj memorijskih kontrolera. Ako pogledamo dijagram Juniper jezgra…
Juniper jezgro
…videćemo da ima mnogo sličnosti sa onim koji smo prikazali pri opisu Cypress-a. Zapravo, Juniper izgleda kao jedna polovina Cypress-a, što se čak prenelo i na memorijski kontroler. Dakle, sada je tu 800 streaming procesora, unutar istih SIMD jedinica, kojih je sada deset u jezgru. O ovim SIMD jezgrima više informacija možete saznati na prethodnoj stranici. Kao i kod Radeon HD4890, HD4870 i HD4850 grafičkih procesora, Radeon HD5700 GPU poseduje 10 teksturnih jedinica, a o njima smo takođe detaljnije pisali na prethodnoj stranici. “Prepolovljen” je i render back-end, pa je broj ovih jedinica kod Juniper-a – 16, ali su one naprednije od 16 ROP-ova kod prethodne generacije (takođe savetujemo da pogledate prethodnu stranu). Memorijski kontroler se sastoji od dva crossbar dela, ili stanice, širine po 64-bita, što daje ukupnu širinu magistrale od 128 bita. Cypress poseduje četiri ovakva kontrolera.
Cypress jezgro
Radeon HD5770 je prva kartica sa Juniper GPU-om koju smo testirali i koju ćemo predstaviti. Grafički procesor, po default-u, radi na 850 MHz, baš kao i kod modela Radeon HD4890, što daje compute moć od čak 1.36 TeraFLOPS-a. Impresivno je da ovaj mali “super kompjuter” sada može biti vaš za 150-ak evra! 1GB GDDR5 memorije bi trebalo da radi na 1200 MHz, a kako je GDDR5 praktično quad-data rate memorija, ova cifra pomnožena sa četiri daje efektivnh 4800 MHz, što je, upotrebićemo ponovo isti epitet – impresivna cifra. Doduše, brza memorija je sada vrlo dobrodošla, jer je magistrala dva puta uža, pa bi Radeon HD5770 mogli da posmatramo i kao karticu sa 256-bitnom magistralom i GDDR3 memorijom na efektivnih 2.4 GHz. Istini za volju, GDDR3 memorija ima nešto oštrije tajminge, ali to kod video kartica nije o tako presudnog značaja za performanse kao kod sistemske RAM memorije.
Tehnologija o kojoj smo takođe pričali na prethodnoj strani, vezana za uštedu energije kada je kartica u idle režimu, odnosno kada je neopterećena, primenjena je i kod Radeona HD5770, a pošto se radi o znatno manjoj kartici, znatno manjem GPU-u i manjoj količini VRAM-a, maksimalna potrošnja u ovoj situaciji (dakle, kada je monitor ugašen i kada mašina, recimo, izigrava download server) je svega 18W, što je još jedan impresivan podatak. Kod Radeon HD5750 modela, Juniper jezgro ima manji broj aktivnih streaming processors jedinica (njih 720, odnosno jedan SIMD unit manje), a sam grafički čip radi na 700 MHz. O ovoj kartici ćemo, naravno, detaljnije pisati kada je budemo imali u rukama. Za sada, pogledaćemo slike i preći na priču o Radeon HD5770 sempl modelu sa testa…
Kartica na testu – AMD Radeon HD5770
Prva Radeon HD5770 kartica koju smo testirali stigla nam je direktno od kompanije AMD i u pitanju je Non Qualification Sample, koji je i identičan prvoj seriji modela koji će stizati i od vendora-partnera. Sama kartica ima isto dizajniran hladnjak kao i Radeon HD5870, ali dok je ovaj model bio dosta duži od sada standardnih Radeon HD4870 i HD4890 kartica, HD5770 je dosta, dosta kraći i manji. Pomenućemo sada i da Radeon HD5850 koristi drugačiji, kraći PCB od najjačeg modela, a mi se pitamo koliki će biti Radeon HD5870X2.
Kako bi Radeon HD5770 kartica bila i tiha u radu, AMD se odlučio da joj podari dual-slot hladnjak sličan onim kod kartica više klase iz prethodne generacije. Spreda gledano, Radeon HD5770 izgleda baš kao i jači brat – Radeon HD5870, ali posmatrane jedna pored druge, HD5770 izgleda kao Boeing 737 pored većeg dvomotorca Boinga 767 (X2 model bi tu onda trebalo da se uporedi sa Jumbo Jet-om). Poređenja radi, i za one koji ne znaju ništa o civilnim avionima, rećićemo samo da Radeon HD5870 ima dužinu od nešto preko 280 milimetara, dok je Radeon HD5850, koji ćemo ubrzo takođe predstaviti, nekih 40 milimetara kraći. Radeon HD5770 je prilično mala kartica za modele ove klase, sa nepunih 210mm dužine.
Naponska jedinica je realizovana u tri faze za GPU, što je sasvim dovoljno, znajući da procesor ne vuče previše struje. Kao i Radeon HD5870, HD5770 koristi digitalne naponske regulatore i kontrolere, a dok ih je kod jačeg modela bilo čak tri sa potpisom kompanije Volterra, Juniper kartici je dovoljan samo jedan (sa potpisom kompanije ST Technology). Kao i Radeon HD 4890, testirana Radeon HD5770 kartica radi na 850 MHz, a gigabajt brze GDDR5 memorije je podešen na realnih 1200 MHz. Osam čipova sa potpisom kompanije Hynix, smešteni su iznad i desno od GPU-a, po četiri, sa obe srane PCB-a. Oznaka na memorijskim čipovina je H5GQ1H24AFR-T2C čiji je propusni opseg 5.0 Gbps, što znači da mogu da rade na frekvenciji od 1200 MHz, ali uz malo viši napon i sve do 1300-1350 MHz.
Crvene linije protežu se sredinom kartice, baš kao sportske šare preko Dodge Vipera i mnogih drugih sportskih mašina u proteklih pola veka. S prednje strane uočljivi su i ovoga puta otvori kroz koje prolazi vazduh, a isti omogućava da se na karticu priključi i šestopinski PCI-E konektor za eksterno napajanje. S obzirom na to da kartica ne vuče više od 108W, 150W koje će pružiti matična ploča i pomenuti priključak, biće dovoljni i za situacije kada su GPU i memorija na kartici – overklokovani. Maksimalna potrošnja Radeon HD5770 kartice, dakle, prema specifikaciji, iznosi 108W pod punim opterećenjem, odnosno sjajnih 18W u stanju mirovanja. Ovo su prilično skromni zahtevi za GPU koji ima preko milijardu tranzistora, a 40-nm proizvodnom procesu možemo da zahvalimo i zbog toga što sam Juniper grafički čip ima površinu od tek 166 kvadratnih milimetara.
Sam kuler je pojednostavljena verzija rashladnog sistema sa većeg modela, ali i on takođe ima svojih iznenađenja. Aluminijumski heatsink sastavljen je od 36 listića dužine od oko 10 cm, a njih na okupu drže dve bakarne toplotne cevi koje dovode višak toplotne energije sa GPU-a. Sve rashlađuje ventilator sa potpisom kompanije Delta – promera od 65 milimetara. Vazduh se kroz tunel izbacuje na zadnjem kraju kartice, kroz otvor iznad video priključaka. Kartica poseduje dva Dual-Link DVI konektora i HDMI, kao i DisplayPort i kao takva podržava ATI Eyefinity, ali ostaje da se vidi da li će partneri takođe, na svoje modele ubaciti sve ove video priključke ili će se zadržati na DVI+HDMI kombinaciji. Naravno, pošto kartica podržava CrossFire i CrossFire X, na njoj su vidljivi i konektori za ostvarivanje CF veze. Sempl kartica koju smo testirali radila je bez problema i ikakvih „bagova“. Pogledajmo i zvaničnu specifikaciju Radeon HD5770 akceleratora:
ATI Radeon™ HD 5770 GPU Feature Summary
• 1.04 billion 40nm transistors
• TeraScale 2 Unified Processing Architecture
o 800 Stream Processing Units
o 40 Texture Units
o 64 Z/Stencil ROP Units
o 16 Color ROP Units
• GDDR5 memory interface
• PCI Express 2.1 x16 bus interface
• DirectX® 11 support
o Shader Model 5.0
o DirectCompute 11
o Programmable hardware tessellation unit
o Accelerated multi-threading
o HDR texture compression
o Order-independent transparency
• OpenGL 3.2 support1
• Image quality enhancement technology
o Up to 24x multi-sample and super-sample anti-aliasing modes
o Adaptive anti-aliasing
o 16x angle independent anisotropic texture filtering
o 128-bit floating point HDR rendering
• ATI Eyefinity multi-display technology2,3
o Three independent display controllers
Drive three displays simultaneously with independent resolutions, refresh rates, color controls, and video overlays
o Display grouping
Combine multiple displays to behave like a single large display
• ATI Stream acceleration technology
o OpenCL 1.0 compliant
o DirectCompute 11
o Accelerated video encoding, transcoding, and upscaling4,5
Native support for common video encoding instructions
• ATI CrossFireX™ multi-GPU technology6
o Dual GPU scaling
• ATI Avivo HD Video & Display technology7
o UVD 2 dedicated video playback accelerator
o Advanced post-processing and scaling8
o Dynamic contrast enhancement and color correction
o Brighter whites processing (blue stretch)
o Independent video gamma control
o Dynamic video range control
o Support for H.264, VC-1, and MPEG-2
o Dual-stream 1080p playback support9,10
o DXVA 1.0 & 2.0 support
o Integrated dual-link DVI output with HDCP11
Max resolution: 2560×160012
o Integrated DisplayPort output
Max resolution: 2560×160012
o Integrated HDMI 1.3 output with Deep Color, xvYCC wide gamut support, and high bit-rate audio
Max resolution: 1920×120012
o Integrated VGA output
Max resolution: 2048×153612
o 3D stereoscopic display/glasses support13
o Integrated HD audio controller
Output protected high bit rate 7.1 channel surround sound over HDMI with no additional cables required
Supports AC-3, AAC, Dolby TrueHD and DTS Master Audio formats
• ATI PowerPlay™ power management technology7
o Dynamic power management with low power idle state
o Ultra-low power state support for multi-GPU configurations
• Certified drivers for Windows 7, Windows Vista, and Windows XP
Speeds & Feeds
Engine clock speed: 850 MHz
Processing power (single precision): 1.36 TeraFLOPS
Polygon throughput: 850M polygons/sec
Data fetch rate (32-bit): 136 billion fetches/sec
Texel fill rate (bilinear filtered): 34 Gigatexels/sec
Pixel fill rate: 13.6 Gigapixels/sec
Anti-aliased pixel fill rate: 54.4 Gigasamples/sec
Memory clock speed: 1.2 GHz
Memory data rate: 4.8 Gbps
Memory bandwidth: 76.8 GB/sec
Maximum board power: 108 Watts
Idle board power: 18 Watts
Test Setup
PCI Express kartice smo testirali na test sistemu prikazanom u tabeli:
Procesor
Intel Core 2 Quad Q6600 @ 3600 MHz (400 MHz x 9), 1600 MHz QPB
Matična ploča
ASUS P5K Premium Black Pearl 18th Anniversary Edition
Memorija
2 x 1Gb Geil PC2-8500 1066GHz @1200MHz 2.25V
Hard Disk
Samsung SpinPoint SATA II, 320 GB, 16MB
Western Digital Caviar 2500JS SATA II 250 GB, 16MB
Video Karte
ASUS N9800GT (512MB GDDR3) – Forceware 185.72
MSI N260GTX (869MB GDDR3) – Forceware 178.13
MSI N260GTX Lightning Black Edition (1792MB GDDR3) – Forceware 182.50
ATI Radeon HD3870X2 (1024 MB GDDR3)- Catalyst 8.1b
ATI Radeon HD4770 (512 MB GDDR5) – Catalyst 9.4b
ATI Radeon HD4870X2 (1024 MB GDDR5)- Catalyst 8.10b
MSI R4870 (512 MB GDDR5) – Catalyst 8.8b
XFX GeForce GTX 285 (1024 MB GDDR3) – Forceware 185.20 beta
VTX Radeon HD4890 (1024MB GDDR5) – Catalyst 9.8
MSI N285GTX SuperPipe 2G OC – Forceware 186.18 WHQL all OS
Gigabyte GeForce GTX 275 (896 MB GDDR3) – ForceWare 186.18 WHQL i 190.3
ATI Radeon HD5870 (1024 MB GDDR5) – Catalyst 8.66 (Catalyst 9.10b)
ATI Radeon HD5770 (1024 MB GDDR5) – Catalyst 8.66 RC6
Monitor
Samsung SyncMaster 244T / 245T
Cooling, Case, PSU
CoolerMaster GeminII*
CoolerMaster WaveMaster
CoolerMaster Ultimate Circuit Protection 900W*
* – ustupio Cooler Master
DVD uređaj
Pioneer DVR-112L
DVD uređaj
Pioneer DVR-108D
Operativni sistem
Windows XP Service Pack 2 (optimized for performance)
Windows Vista SP1 (default)
DirectX 9.0c
DirectX 10
Igre/Bench programi
3D Mark Vantage
3D Mark 06
SPEC.ORG SpecviewPERF 10
Enemy Territory: Quake Wars
Prey
Company of Heroes 1.3
Battlefield 2142
Unreal Tournament 3
Lost Planet: Extreme Conditions
Call of Duty 4: Modern Warfare
Left 4 Dead
Assassin's Creed DX10.0
Far Cry 2
Crysis 1.3
Fallout 3
Race Driver: GRID
Need For Speed: ProStreet
Tom Clancy's H.A.W.X
X3: Terran Conflict Demo Benchmark
World in Conflict
S.T.A.L.K.E.R
F.E.A.R 1.08
FutureMark 3DMark 06 Pro
Pretposlednje izdanje 3DMark benchmarka može da se izvršava samo sa Direct X 9 kompatibilnim akceleratorima. Tri prerađena testa iz verzije “05” koriste Shader Model verzije 2.0, dok najnoviji zahteva SM3.0 i 256 MB video memorije. Sva tri game demoa su izuzetno zahtevna, karakteriše ih još veći broj poligona koji opterećuje VS jedinicu, kompleksni shader programi (mapiranje neravnina, osvetljenja, emulacija pravog HDR osvetljenja, particle efekti, dinamične i meke senke, subface scattering, napredni fog efekti (emulacija volumetric efekta), ali i dosta postprocesing efekata. Novi test – Deep Freeze je grafički najimpresivniji, a novi 3DMark ima i napredni CPU test, koji simulira upotrebu A.I. rutina u igrama, kao i kalkulacije vezane za samu fiziku.
FutureMark 3DMark Vantage
Iako nije toliko vizuelno impresivan kao njegovi prethodnici, 3DMark Vantage je zapravo dosta bolje osmišljen GPU i gaming benchmark uopšte. Pažnja je ovoga puta usmerena na funkcije koje se izvršavaju ili će se uskoro izvršavati unutar igračkih “endžina”, a ne na sam artwork. Prvi od dva grafička testa, Jane Nash (Graphics Test 1) testiraju simulaciju tečnih povšina i generisanih tekstura, kao i GPU-kalkulisane sisteme čestica, a u čitavoj sceni se u realnom vremenu u obzir uzimaju i uticaj gravitacije na objektima (pa i na “objektima” glavne junakinje), zakon inercije i impulsa sile (prva dva Njutnova zakona), kao i zakon akcije i reakcije, uz uticaj otpora vazduha. Fiziku kalkuliše GPU, a da sve ne bi ostalo samo na kalkulacijama “ispod”, 3D scena je opterećena brojnim dinamičkim izvorima osvetljenja sa kompleksnim senkama, a voda, koja je refleksivna i refraktivna, se ne pomera na predefinisan način, već se svaki talas u realnom vremenu i dinamički generiše. Drugi test, New Calico, podseća na igru X3:The Threat i ne sadrži objekte sa skinovima (bez zglobova), ali zato poseduje ogroman broj objekata u sceni, sa shadow mapama različitog tipa. Po prvi put u 3DMark benchmark programu, prisutni su i global raytracing efekti ((Parallax Occlusion Mapping, True Impostors i volumetric fog). Treći test pokušava da izmeri performanse CPU-a u kalkulacijama veštačke inteligencije i fizike. Broj “gejtova” kroz koje proleću avioni je srazmeran broju jezgara sistemskog procesora, a ako u sistemu posedujete i hardver za kalkulaciju fizike (PPU), ovaj broj se povećava za tri. Nakon, standardnih, na red dolaze i “sintetički” testovi: texture fillrate, color fillrate, paralax occlusion mapping, gpu clothing, particles, noise…
SpecORG SPECviewperf 10
Koristili smo nešto stariju, ali stabilnu verziju koji se sastoji od čak osam celina. SpecviewPerf meri performanse sistema pod OpenGL API-jem tako što simulira osam standardnih industrijskih aplikacija. 3Dsmax-03 je baziran na SPECapc za 3dS MAX u OpenGL okruženju. U sceni su tri modela sastavljena od po približno 1.5 miliona vertices-a, a testiranje se vrši uz nekoliko tipičnih tipova osvetljenja. Catia-01 je bazirana na Dassault CATIA inžinjering aplikaciji u kojoj modeli imaju do dva miliona osnovnih linija. Ensight-01 je simulacija CEI EnSight inžinjering aplikacije koja se koristi za vizuelizaciju. U test su ubačeni displej-list i fast preview modovi rada. Umesto Lightscape aplikacije , tu je sada TeamCenter Visualisation (tcvis-01), a Maya-02, kako joj i samo ime govori, simulira radno okruženje paketa kompanije Alias – Maya 7, nezamenljivi alat filmadžija u Holivudu. Proe-04 je baziran na SPECapc okruženju za Pro-Engineer 2001, koji u sceni primenjuje dva modela u tri shade moda (senčeni, wireframe i hidden-line removal). SW-02 simulira Solidworks 2008 aplikaciju, koju izdaje Dassault Systems i konačno, test Ugnx-01, baziran na SPECapc Unigraphics aplikaciji, u kojem je prikazan model motora SUV automobila sastavljen od više desetina miliona osnovnih linija. SPECviewperf 10 je znatno znatno zahtevniji od ranije korištene verzije 8.1. Pogledajmo rezultate:
Lost Planet: Extreme Condition
Lost Planet: Extreme Condition je za Xbox360 izašao početkom 2007 godine, a nešto više od godinu dana kasnije, pojavio se i u verziji za Windows XP i Vista platformu sa podrškom za rad kroz DirectX 9 i DirectX 10 API-je. Kao i u verziji za Xbox360, poseduje veliki broj “next-gen” efekata, uključujući i filmske efekte poput full-frame motion blur-a, depth of field-a, a posebno se ističu napredni particle efekti koji verno oslikavaju žestoke zimske uslove, vatru, paljbu iz futurističkog oružja i sl. Na Microsoft konzoli radi u 720p rezoluciji sa oko 30-35 fps, ali kako podržava više radne rezolucije na Windows platformi (rezolucije tekstura, poligoni i sl. su identični Xbox360 verziji), predstavlja dosta dobar alat za testiranje novih grafičkih kartica. Iako gotovo tri godine nakon što je završena, igra po današnjim standardima ne izgleda impresivno, ume da bude prilično zahtevna. Mi smo testirali kroz prvi “built-in” test, uz maksimalan nivo detalja, u DirectX10 okruženju pa pogledajmo rezultate:
Call of Duty 4: Modern Warfare
Za razliku od prethodnika, Call of Duty 4: Modern Warfare igrača postavlja u okršaje novijih datuma. Baziran je na unapređenom “motoru” svojih prethodnika, posebno verzije iz trećeg dela, koji se pojavio isključivo u verziji za Xbox360 konzolu. U pitanju je dobro optimizovana igra, čiji engine koristi i novi nastavak Call of Duty: World at War. Broj detalja odnosno dešavanja u sceni u svakom trenutku je fantastično veliki, bilo da su u pitanju sitnice poput mapiranja neravnina, bloom i HDR efekti, dinamičke senke i osvetljenja, efekti eksplozija i dima ili sveprisutni depth-of-field tokom zumiranja. U igri svaki metak prolazi kroz materijale kroz koje bi prošao i u realnoj borbi (drvo, staklo, tanak metal), uz adekvatno usporenje i izmenu pravca. Igra koristi isključivo DirectX 9.0c, odnosno Shader Model 3.0, a u verzijama za Xbox360 i PlayStation 3 izgleda kao i sa maksimumom detalja na PC-ju, kako smo je i mi testirali. Pogledajmo rezultate:
Enemy Territory: Quake Wars
Multiplayer igra u Quake univerzumu, koja cilja publiku “navučenu” na Battlefield, Team Fortress i Unreal Tournament, zapravo je svojevrsni prequel Quake-a II i njena radnja je smeštena na Zemlju, u sred sukoba Strogg-ova i ljudi. Novi Doom 3 MegaTexture engine u ETQW je negde na pola puta do pravog naslova sledeće generacije (koji ćemo u različitim verzijama videti u igrama Doom 4 i Rage), ali je princip rada identičan. Engine se oslanja na OpenGL i baziran je na mapiranju terena i svih objekata jednom mega-teksturom koja se direktno “ucrtava” na geometriju. Ova pametna, gigantska tekstura objektima daje i svojstva, što developerima igara daje puno slobode pri kreiranju ogromnih, detaljnih terena i vrlo unikatnih objekata (teksture se ne ponavljaju). Iako prva Doom 3 MT igra ne izgleda toliko impresivno (Crysis je ipak postavio neke standarde isuviše visoko), vrlo je dobro optimizovana. Testirali smo, naravno, na maksimalnom nivou detalja…
Resident Evil 5 benchmark
Ova survival horror igra je inicijalno razvijena za Xbox 360 i PlayStation 3, a nedavno se pojavio i Benchmark Demo za PC, ali i kompletna igra. Razvojni tim Capcom stoji iza naslova kakvi su Lost Planet i serijal Onimusha, pa je jasno da je grafička prezentacija na visokom nivou, a posebne reči hvale se mogu uputiti za optimizaciju, jer je ova igra, kao jedna od najlepših akcionih arkadnih igara ovog tipa na PC plaformi istovremeno i jedna od najmanje zahtevnih. Engine se oslanja uglavnom na funkcije DirectX 9.0c API-ja, mada igra zvanično podržava DirectX 10, ali ne koristi njegove napredne mogućnosti. Na PC platformi, igra podržava i GeForce 3D vision sistem naočara koji omogućava dublji “immersion” u samu igru. U benchmark demou, koji je izašao mesecima pre same igre, sva podešavanja smo postavili na maksimum i testirali sa i bez anisotropic i antialiasing filtera. Testirali smo DirectX 10 verziju. Pogledajmo rezultate:
X3: Terran Conflict
Nastavak, odnosno ekspanzija čuvene igre X3: Reunion, Terran Conflict je igra koja vam omogućava da iskusite život u svemiru, u dalekoj budućnosti. Možete graditi, trgovati, boriti se ili biti samo istraživač. Igra je inicijalno posedovala fenomenalnu grafiku, a kako je Terran Conflict urađen oko istog “endžina”, ona danas ne izgleda toliko impresivno, iako je i dalje vizuelno vrlo atkrativna. Modeli brodova su bogato dizajnirani, raznovrsni i po tipu, i po veličini i po ulozi koju imaju, sa velikim brojem poligona (često preko pola miliona po sceni) , opskrbljeni fantastičnim color i displacement (bump) teksturama. Okolina (sam svemir, planete, asteroidi, magline…) i bogati particle efekti doprinose utisku, a zahtevnost igre je povećana kompleksnijim modelima brodova i većim brojem asteroida u poređenju sa prethodnom igrom, zbog čega smo Terran Conlict Benchmark demo uvrstili kao standardan deo naše test palete.
Company of Heroes 1.3
Prva real-time strategija u našem test-suite-u, Company of Heroes, koristi posebni next-gen engine koji Relic naziva “Essence Engine”. Ovaj engine podr žava sve nove fancy efekte kao što su High Dynamic Range i dinamičko osvetljenje, per-pixel senke, a displacement (normal) mapping je vidljiv na mnogim objektima. Takođe, igra se obilato oslanja na napredne shader rutine, ali i licenciranu Havoc fiziku, a pojedini objekti su destruktabilni, što donekle važi i za teren. Kao i obično, u igri smo uključili sve moguće efekte, što se po frame-rate-u i vidi:
World in Conflict
Druga real-time strategija u našem test-suite-u, World in Conflict, verovatno je i dalje najimpresivnija RTS igra koja je izašla na PC tržište. Bazirana je na novom Direct3D “endžinu” koji podržava čitav spisak novih efekata kakve smo do sada viđali samo u, po pravilu najinovativnijim FPS igrama. Dakle, tu su HDR, bloom i dinamičko osvetljenje, per-pixel senke, destruktabilni teren i adekvatni view-sight, paralax i normal mapping, depth of field i čitav niz drugih filmskih postprocessing efekata . Naravno, mi smo testirali sa maksimalnim nivoom detalja:
Battlefield 2142
Umesto igre Battlefield 2, koristili smo novi Battlefield 2142, smešten u periodu dva veka nakon Drugog svetskog rata. Igra je patch-ovana na 1.10 verziju (aktuelnu v1.50 ne koristimo zbog baze rezultata za kartice koje smo već testirali). Ova igra je bazirana na istoj mašini kao i Battlefield 2, ali uz nekoliko dodataka u koje spadaju detaljnije teksture, povremeni normal mapping, parallax mapping, dinamičko osvetljenje i senke, post processing efekti. Igru smo testirali na najvišim setovanjima na jednoj od zahtevnijih mapa. Pogledajmo rezultate:
Unreal Tournament 3
Unreal Engine 3 je najpopularniji “motor” koji koristi poslednje dve generacije DirectX API-ja i pored CryEngine 2, predstavlja trenutni “vrh ponude” kad je igračka industrija u pitanju. Nema potrebe da nabrajamo šta sve podržava, samo ćemo pomenuti neke prelepe naslove koje ste verovatno već videli ili igrali: Bioshock, Rainbow Six: Vegas 2, Medal of Honor: Airborne, Gears of War 2, Mass Effect, Stranglehold i plejada drugih igara koje su već izašle u verzijama za Xbox 360 ili su u najavi. Demo Unreal Tournament 3 igre ne omogućava maksimalan već samo visok nivo detalja kad su u pitanju teksture, međutim, i ovo je dovoljno zahtevno da i najnovije grafičke kartice stavi na muke.
Assassin's Creed DirectX 10.0
Smeštena u vreme Templata, u drevni Jerusalim (ali zapravo i u blisku budućnost), igra Assassin's Creed je akciona igra sa elementima šunjalice, koja se izvodi iz trećeg lica. Pokreće je revolucionarni engine koji je razvijan za konzole aktuelne generacije (Xbox360 i PS3), ali tek na PC-ju pokazuje koliko zaista može, jer može da radi u značajno višoj rezoluciji od one koja je za konzole standardna (1280 x 720 piksela). Igra koristi sve napredne shader tehnike koje možete videti u najmodernijim igrama kakav je, recimo Crysis, a još uvek spada u jednu od najlepših igara koje se mogu igrati na PC platformi. Mi smo testirali na najvišem mogućem nivou detalja, u DirectX 10.0 režimu, bez patch-a za DirectX 10.1 i narednog, koji ga je poništio.
Far Cry 2 Benchmark
Nastavak jedne od najimpresivnijih igara svog vremena, fenomenalnog FarCry-a, koristi posebno razvijani Dunia Engine. Ovaj engine podržava sve moderne efekte DirectX 9.0c API-ja za prikaz grafike, ali i napredne mogućnosti kao što su destruktivni teren i objekti, dinamičko širenje vatre u odnosu na vremenske uslove i vetar, specijalne atmosferske efekte (realne simulacije oluje), izmene dana i noći, napredni ne-skriptovani A.I. Engine podržava DirectX 9.0c, ali i DirectX 10, a posebna pažnja pri njegovom razvoju poklonjena je optimizaciji za Xenos GPU na Xbox 360 konzoli. Generalno, Dunia Engine implementiran u Far Cry 2 jeste manje grafički zahtevan of Cry Engine 2 “motora” koji se koristi u igrama Crysis i Crysis Warhead. Mi smo koristili maksimalan nivo detalja, plus dodatnu modifikaciju za dalje iscrtavanje detaljnijih objekata (povećan ukupan LOD) i kompletne 3D vegetacije na daljim udaljenostima od “kamere”.
Crysis 1.3 Benchmark
Šta reći o najdetaljnijoj, grafički najimpresivnijoj igri i najzahtevnijoj igri današnjice. U odnosu na Call of Duty 4 ili bilo koju drugu igru koja vam može pasti na pamet – Crysis je bar za dva koplja iznad. Čak i na GeForce GTX280 karticama i Quad Core mašinama, prosečan frame-rate iznosi tridesetak frejmova po sekundi, u iole višim rezolucijama. Mi smo testirali kroz standardni GPU benchmark i to uz trik koji nam omogućava da “DX10-only” efekte vidimo i u DX9 okruženju, ali smo koristili naš custom .ini fajl koji omogućava još veću daljinu iscrtavanja (slično smo ranije radili i sa FarCry igrom), veći broj dinamičkih osvetljenja i senki, precizniji enviroinment mapping i refleksije… Najbolji opis grafičkog nivoa ove igre na ovakvom nivou detalja, koji je u odnosu na Very High za jedan stepenik iznad, zvuči otprilike ovako: koliko je FarCry tehnički ispred prvog Quake-a, toliko je Crysis ispred svog pomenutog prethodnika.
Left 4 Dead
Nama veoma drag serijal Half Life, zamenili smo modernijom i intenzivnijom surival-horor akcionom igrom, koja poseduje ugrađeni benchmark demo. Left 4 Dead je poslednji hit iz Valve radionice, izrađen oko poboljšane verzije Source 2.0 endžina, korištenog u poslednjoj HL2 Episode 2 igri. Igra je smeštena u apokaliptičnu blisku budućnost, nakon pandemije virusa koji je veći deo planete pretvorio u zombije na stereoidima, dok je deo preživelih ostavio da rade upravo to – preživljavaju. Igra je najzanimljivija u kooperativnom multiplejer režimu, koji se može igrati kao versus mod (slično deathmatchu) ili kao co-op kampanja. Poboljšanja na Source “motoru” obuhvataju bolju podršku za višejezgarne procesore, animacija koja se oslanja na integrisani fizički endžin, prilično je dorađen i AI, a dodate su i novine koje nismo viđali u Half Life igrama, kakvi su self-shadowing, normal mapping i veliki broj post-processing trikova koje Valve objedinjuje pod nazivom cinematic visual effects (color contrast, sharpening, multi-focusing, film grain, vignetting itd.). Pogledajmo rezultate koje smo postigli uz najviši nivo detalja.
F.E.A.R 1.08
Ova fantastična, grafički impresivna i veoma zahtevna horror igra je dobila zasluženo mesto u našem test batch-u. Testirali smo u “ugrađenom” walkpath demou, koji ispisuje prosečan broj frejmova. Naravno, sve moguće opcije vezane za grafiku, fiziku i zvuk smo stavili na maksimum – sve osim mekih senki, koje ne rade sa antialiasingom.
S.T.A.L.K.E.R: Clear Sky
Nakon izlaska naslova S.T.A.L.K.E.R.: Shadow of Chernobyl, ukrajinski razvojni tim GSC Game World se ponovo okušao u oživljavanju Zone, kroz novo izdanje, S.T.A.L.K.E.R.: Clear Sky. Ovoga puta, kontaminirana teritorija pod nazivom Zona izgleda još impresivnije nego prvog puta. Zapravo priča, S.T.A.L.K.E.R.: Clear Sky se odvija pre prvog dela tako da oni koji prvi deo nisu odigrali imaju mogućnost da to urade sada i upotpune Clear Sky priču. Nažalost, kao i u prvom delu bagova ima, ali se oni uz pomoć mnogobrojnih modova mogu donekle srediti. Igra podržava directX 10 instrukcije i putem mnogobrojnih novih i starih efekata poput smene dana i noći, sunčevih zraka, kiše, munja, mokrih materijala, doprinosi novoj realnosti “Zone”. Optimizovanost i dalje nije na zadovoljavajućem nivou, ali kako igra izgleda grafički prelepo, nije ni čudo što i današnji grafički adapteri imaju velikih problema da izađu na kraj sa njom. Jedno je sigurno, igra će vas sigurno zaintrigirati, što svojom lepotom, što pričom i teritorijom za koju je vezana, pa ćete i oprostiti nedovoljnu optimizovanost i poneke probleme.
Fallout 3
Fallout 3 je fantastični post-apokaliptični RPG smešten u 2277 godinu, nakon dešavanja iz prethodne dve igre. Kao i The Elder Scrolls IV: Oblivion, igra koju smo (na ovom mestu) ranije koristili za merenje performansi grafičkih kartica, Fallout 3 je nelinearna role-play igra sa izvođenjem iz trećeg lica, koja po mnogim stvarima podseća na “Oblivion”, a i bazirana je na istom “Gamebryo” endžinu. Njegova implementacija u tri godine novijoj igri izgleda daleko bolje, pa se u Falloutu 3 ne dešava da određena stena ili drvo “iskoče” dok se krećete kroz razrušenu pustoš nekadašnje Virdžinije (okolina Vašingtona). Grafika je na PC računarima, uz “Ultra” preset, na momente zaista fascinantna, a treba imati u vidu da se radi o prostoru koji je veći i od onog u Crysis ili FarCry igrama, kao i da je Fallout 3 manje zahtevna igra od pomenutih. Fallout 3, kao ni Oblivion, nemaju ugrađeni “benchmark” program, niti bilo kakvu vrstu time-demo, pa je neophodno napraviti walkthrough sa iste lokacije i to ponoviti tri puta. Svaka od tri vožnje je merena Fraps-om, zabeleženi su srednji rezultati, a u rezultatima prikazujemo prosečni fps. Naravno, koristili smo najviši nivo detalja koji je moguće postići iz same igre, kao i dodatni HD texture mod, koji se besplatno može preuzeti sa velikog broja mod-foruma.
Race Driver: GRID
Ljubitelji Codemastersovih igara, odnosno arkadnih vožnji koje ipak poštuju nekakve zakone fizike (za razliku od igara iz Need For Speed serijala), s nestrpljenjem su dočekali igru u kojoj igrač učestvuje u standardnim uličnim trkama. Potpuno drugačije koncipiran od odličnog Colin McRae DIRT naslova, GRID koristi unapređenu verziju Neon endžina, koji Codemasters naziva Ego Engine, a koji donosi realističniji “damage model”, preciznije osvetljenje i sistem senki, a usput je dosta bolje optimizovan od prethodnika. Igra je inicijalno razvijana za Xbox360, ali ne treba očekivati viši nivo detalja u odnosu na CMR: DIRT – iako su staze znatno bogatije okolnim objektima (trke se odvijaju u gradovima), isti imaju nešto manji broj detalja, iako sama igra, nakon primene modernih motion blur, bloom, HDR i drugih post-processing efekata, izgleda zaista dobro. Na PC platformi postoje različite modifikacije za poboljšanje grafike, koje mi ovoga puta nismo koristili – standardno, sve smo povećali na maksimum. Pogledajmo rezultate:
Need For Speed: Shift
Nova generacija čuvenog racing serijala Need For Speed, sada koristi još unapređeni “engine” za prikaz grafike, ali i nešto manje arkadni fizički model, preuzet iz igre Ferrari Project, što se većini dopalo posle manje uspešnih nastavaka ProStreet i Underground. Ovaj multiplatformski naslov je isprva bio pomalo problematičan za PC, ali smo ubrzo nakon što je izašao uspeli da ga “dovedemo u red” i nateramo da jednako dobro radi na ATI i NVIDIA karticama. Znatno je grafički poboljšana u odnosu na prethodnike, a modeli automobila i okolinih objekata su realističniji, bez nepotrebnih šljaštećih efekata i uz realističan prikaz enterijera (koji nije postojao u NFS serijalu još od naslova Porsche Unleashed iz 2000. godine). Motion blur je daleko suptilniji nego ranije, a dodat je i prilično atraktivan dinamički efekat koji dočarava neudobnost sportskih automobila. Teksture su detaljnije, broj animiranih objekata znatno veći, a particle efekti, a posebno dim, značajno su upečatljiviji. Depth of Field i HDR su standardna pojava, a dizajneri igre tvrde i da su i oblaci volumetrijski.
Tom Clancy's H.A.W.X.
H.A.W.X je borbena avio simulacija arkadnog tipa, koja poseduje i priču koju je osmislio čuveni američki pisac Tom Clancy, direktni krivac za veliki uspeh hit serijala kakvi su Rainbow Six, Ghost Recon, Splinter Cell i EndWar. Radnja koja prati tok igre, prepliće se upravo sa naslovima Tom Clancy's Ghost Recon Advanced Warfighter 1 i 2, kao i RTS igrom EndWar. H.A.W.X poseduje dva moda – safe (ERS) i advanced (ERS off), pri čemu je ovaj drugi i vizuelno dosta atraktivniji, ali i za nijansu realniji (avioni dosta lakše padaju u kovitlac). Ipak, treba znati da igra predstavlja najčistiju moguću arkadu, jer sa avionima ne možete nigde sleteti, ali ni usporiti ispod 900 km/h, čak ni sa onim koji to u realnosti mogu (npr. Sea Harrier britanske mornarice). Modeli aviona su vrlo detaljni, a teksture i okolina skoro foto-realistični (korištene su GeoEye Earth-imaging IKONOS mape). Sama igra je prilično dobro optimizovana, pogotovo ako je pokrenete u DirectX 10.1 modu (na odgovarajućoj kartici, naravno), a mi smo testirali na najvišem nivou detalja.
Overclocking
Radeon HD5770 radi na 850 MHz za jezgro i 1200 (4800) MHz za memoriju. Našu test karticu smo uspeli da ubrzamo solidno preko propisanih vrednosti bez ikakvog volt-modovanja putem softvera, za šta tokom prvog, kratkog druženja sa njom nismo imali vremena. Tako smo stigli do veoma dobrih 930 MHz za jezgro i 1300 (5200) MHz za VRAM. Maksimum koji dozvoljava Catalyst Overdrive je 960 MHz za GPU i upravo tih 1300 za VRAM. Pogledajmo kako izgledaju oko 7-8% viši rezultati.
Zaključak
Ako ste pročitali naš prethodni test, koji je govorio o Radeon HD5870 akceleratoru – kartici koja je donela mnogo toga novog, znate da smo u zaključku priznali da nas je oduševila. Ne samo što je to najbrži GPU koji danas možete nabaviti, već je i tehnološki najnapredniji. I smatramo da je njegova tržišna cena prilično korektna i dobro odmerena. Pa ipak, potreba za igranjem u najvišim rezolucijama, uz maksimalan nivo umekšavanja ivica i anizotropnog filtera nije potrebna baš svakom korisniku i tada se postavlja pitanje – čega se mora odreći kupac jeftinije, srednje klase akceleratora? Da li će on biti uskraćen za neke mogućnosti koje nudi viša klasa? AMD je danas dao odrečan odgovor na to – ušavši u drugu fazu izvršavanja svoje Sweet Spot strategije, koju uspešno primenjuje već treći put. Radeon HD5770 nudi sve ono što i njegov snažniji brat, a ako se već odričete dela snage i ograničavate na nešto niže grafičke režime, to ne znači da neke od novih feature-a u novim igrama nećete videti. Sve što će biti potrebno je držati se neke niže rezolucije, koja će u 98% slučajeva pružiti sasvim dovoljno dobro iskustvo (a igranje u 1280 x 768 piksela se ne može nazvati lošim iskustvom). Kompanija AMD je još jednom uspela da ispuni sva naša očekivanja, a što nam je posebno drago, učinili su to opet na više nivoa. Oduševljeni smo činjenicom da kartica koja nije preglomazna i koja je prilično štedljiva, te koja koristi 128-bitnu magistralu, ne zaostaje mnogo za modelima prethodne generacije, koji imaju duplo širu “komunikaciju” sa VRAM-om. Kao da nam svaki put iznova, AMD pokaže koliko je konkurencija propustila time što njihovi GPU-ovi nisu podržali ovaj tip video memorije.
S druge strane, AMD je konačno rešio da stopira prednost koju konkurent i dalje ima u klasi kartica od 120-ak evra, a koju i dalje “opsedaju” arhaični GeForce GTS 250 (odnosno GeForce 9800) modeli. Sasvim je izvesno da će i u ovoj nameri uspeti, jer Radeon HD5770 nudi mnogo više, bez obzira na to šta posmatrate. Jedini problem koji skuplja izdanja ove kartice mogu imati na evropskim tržištima su zaostale količine GeForce GTX260 kartica, čije su se cene opasno približile onim po kojim bi trebalo da se prodaju novi Radeoni. Problem koji ovaj model konkurenta može da napravi je kratkog daha i tiče se samo performansi. Kada su dimenzije, zagrevanje, buka u radu, potrošnja i mogućnosti u pitanju – novjlija iz AMD-a ima konkretne i očigledne prednosti. Ovo je naš prvi test Radeon HD5770 kartice i sa njom ćemo se vrlo brzo ponovo družiti, a tada ćemo videti i kako se ona ponaša sa novijim drajverima, uporediti je sa još modela iz konkurencije i proveriti da li i koliko ima smisla koristiti je u CrossFire režimu, kada može predstavljati opasnost i za GeForce GTX285. Za sada, možemo samo da joj predvidimo lep i dug tržišni život…
AMD Radeon HD5770 na test ustupio AMD.