Branko Maksimović
MSI RX4870 i RX4850
Uvod
Naš prvi test GeForce GTX280 kartica smo započeli konstatacijom da je IT scena neverovatno dinamična. U jednom trenutku, NVIDIA smatra da je je aposlutni pobednik upravo njihovo najjače izdanje GT200 akceleratora, a već u sledećem najavljuje njeno drastično sniženje. Čak ni Graphzilla nije znala koliko ih “posrnuli AMD” bolno može iznenaditi – arogantni američki dizajner GPU-ova je “u roku od odmah” imao priliku da oseti ozbiljnost situacije. Vrednost akcija ove kompanije su nedeljama padale i za nekoliko procenata dnevno. Kako nesreća nikad ne ide sama, otkriveno je i da je dobar broj mobilnih i desktop grafičkih procesora iz mainstream segmenta defektno. Stručnjaci navode da će NVIDIA prijaviti jedan od svojih “najlošijih kvatala” upravo po isteku Q32008, ali i da će se profit koji jedna “GPU-kompanija” može da ostvari, generalno – smanjiti. Još jedan indikator fantastične dinamike promena na tržištu discrete grafike najbolje će ilustrovati situacija sa GeForce 9600GT karticama. Kada su se pojavile, od nas, a i od stranih kolega, dobile su zaista pohvalne kritike. Opisane su kao najlogičnije i najbolje rešenje u klasi od 199 dolara tj. 150 evra. Konstatovali smo da je dobro što se 256-bitna magistrala i brzi DDR3 preselio u srednju klasu i dopalo nam se što je GeForce 9600GT startovao po cenama koje su od 40 do 50 evra niže od onih koje su inicijalno važile za inferiorni GeForce 8600GT. GeForce 9600GT je bio dostojan konkurent Radeonu 3850 i, kao što je Radeon HD3870 uslovio niže cene za prve G92 kartice (GeForce 8800 GT i GTS), tako je i GeForce 9600GT poslužio kao katalizator za dalji pad cena jeftinih RV670 modela. AMD je, zatim, u priču ubacio RV770, uzeo kokice i Coca-Cola Zero, seo u prve redove i posmatrao pilot epizodu sopstvene španske serije. Jer, kako drugačije nazvati ono što se tada desilo? Čak i slabiji model RV770 kartice, koji u trenutku pojavljivanja košta koliko i već odomaćeni GeForce 9600GT, uspeva da prestigne i GeForce 9800GTX, koji je dve klase iznad (između se, bar ako posmatramo cene, nalaze GeForce 8800 GT i GTS 512 kartice). Tako je, u našem slučaju, prvi deo uporednog testa najpopularnije GeForce kartice, proglasio ove modele uspešnim predstavnikom srednje klase, dok je u drugom delu postao praktično deplasirana roba, jer se za sličan novac može pazariti daleko brži Radeon HD4850. Lansiranje GT200 kartica je bukvalno zasenila ova sjajna AMD kartica, koja je počela da se prodaje kao vrući kolačići (doduše, i sam HD4850 nije da nije vruć :), a što je najzanimljivije – ovi akceleratori čak i ne pripadaju istim klasama. NVIDIA panično ubrzava launch GeForce 9800GTX+ kartica, koji se pokazao kao “papirni”, jer su se modeli u prodaji pojavili tek tri nedelje kasnije (kod nas ih još uvek slabo ima u prodaji) i daje mu cenu koja je preporučena i za konkurentski Radeon HD4850. GeForce 9800GTX dobija smešno nisku poziciju, koja “po inerciji” gura GeForce 9600GT još niže i prosto istiskuje GeForce 8800GT i GTS modele kojih u kanalu još uvek ima u solidnim količinama. Partneri kompanije NVIDIA kreću da paniče, ali pravi problemi tek nailaze. Radeon HD4870, koji na tržište stiže par nedelja nakon HD4850 modela, znatno je brži od svog “malog brata” zahvaljujući prebrzoj GDDR5 memoriji, pa se pokazalo da je i GeForce GTX260 za njega lak zalogaj. Iako je ovaj glomazni akcelerator baziran na istom GT200 čipu kao i monstrumski GTX280, NVIDIA obara cenu ovog modela sa 449 na 399 dolara, a zatim i na 349 dolara, dok njeni partneri samoinicijativno spuštaju cenu i na 299 dolara. Da li se ikad desilo da jedan GeForce pojeftini za 50% u roku od samo nekoliko sedmica? Ako ovu situaciju uporedimo sa modelom GeForce 8800 GTX, čija je cena pala za 10-12% za 18 meseci, onda moramo da konstatujemo da nešto nije u redu, bar za jednu od “zaraćenih” strana.
Kada je dobio odgovarajuću cenu, GeForce GTX260 je krenuo i solidno da se prodaje. Međutim, podsetićemo vas da i GTX260 zahteva prilično kompleksan PCB i naponsku jedinicu, te da je izuzetno skup u proivzodnji i vrlo je diskutabilno koliko NVIDIA i partneri zarađuju (ili gube) prodajom ovih kartica. Situacija sa GTX280 modelima je znatno teža, pa ni nakon sniženja sa 650 na 500 dolara, ne ostvaruju zavidnu prodaju. Da NVIDIA svoje probleme neće tek tako rešiti, postarao se Terry Makedon sa svojim Catalyst timom, koji je izbacio novi drajver za sve Shader Model 4.1 akceleratore, koji prilično povećava performanse u nekim situacijama, a pogotovo u CrossFire režimima. Tako i dve Radeon HD4850 kartice postaju alternativa skupom GTX280 modelu, a zahtevni korisnici još željnije iščekuju Radeon HD4870X2. Svega par nedelja od naizgled trijumfalnog lansiranja GTX200 familije, pojavljuju se i prve vesti o tome kako NVIDIA užurbano radi na derivatima GT200 čipa koji će podržavati i DirectX 10.1, koji AMD Radeon modeli podržavaju već dve generacije unazad, kao i GDDR5 memoriju, koju je američka kompanija, kao i GDDR4 do sada praktično ignorisala. GDDR5 je, pak, previše “velika stvar” da bi NVIDIA pred njom tako dugo mogla da žmuri. I upravo je ona “kriva” za uspehe koje je doživeo ATI Radeon HD4870…
RV770 – rekapitulacija
AMD je sasvim sigurno mogao da kreira nekakav ogroman “monolitni” GPU (fiktivni R720), koji bi bio četiri puta veći od RV670 i bar dva i po puta moćniji. No, cena kartice na koju bi on išao bi prevazišla ono što je velik broj kupaca spreman da plati. Yield za takav GPU bi bio loš, a kompaniji AMD u ovom trenutku nikako nisu potrebni gubici; problemi sa napajanjem, zagrevanjem (odnosno hlađenjem) bi svakako postojali, a u ranim fazama razvoja je teško predvideti da li će oni biti rešivi ili „rešivi“. Međutim, čak i da AMD ima daleko više resursa, novi strateški put je uslovio da naredna generacija grafičkog procesora treba da izgleda drugačije. Novi GPU bi, jednostavno, morao da gađa tačno u metu „best buy“ rešenja u više srednje klase. Ultra-efikasan GPU ne mora samo da ima najbolje performanse po ponuđenoj ceni – AMD naglašava da je bitno ostvariti napredak (u odnosu na prethodnu generaciju, a pogotovo u odnosu na konkurenta) i kada su u pitanju kategorije „performanse po utrošenom vatu“ ili „performanse po milimetru površine koji GPU zauzima“. Iako sve zvuči kao da AMD sam sebe tapše po ramenu i teši se što nema najbrži GPU, situacija je danas, nakon što su AMD i NVIDIA otkrili karte, daleko od one u kojoj AMD odlazi sa olimpijade sa utešnom nagradom.
Vreme velikih „monolithic“ GPU-ova (kako ih AMD naziva) je prošlo. Cena za njihov razvoj i sama cena kartice je previše velika i najveći broj igrača i nema ili ne želi da da toliko novca da bi ih posedovali, bez obzira na performanse koje nude. Ove kartice koštaju više od 500 dolara, a vuku preko 250W pod punim opterećenjem. Čak i kada se ponude jeftinije varijante sa delom pipeline-a koji je isključen, kartica proizvođača, ali i čip-dizajnera ne košta mnogo manje; manja je samo zarada, jer se koristi isti ili vrlo sličan PCB i ista, skupa memorija. Ako se, pak, krene sa GPU-om koji košta oko 250 do 300 dolara (na kartici koja predstavlja njegovo najjače izdanje) i troši maksimalno 150W u 3D režimu, dobija se rešenje koje u startu ima odličan odnos cene i performansi, a lako se, uz srazmerno malo dodatnog R&D vremena, specifičnoj ciljnoj grupi mogu ponuditi dual-GPU rešenja koja će nuditi adekvatno više performanse. Naravno, kao što smo i zaključili u našem testu AMD Radeon HD3870X2 kartice svako dual-GPU rešenje ima svojih mana, a one su najviše vezane za činjenicu da je efektivna količina memorije dva puta manja od one koja je fizički prisutna i da performanse često variraju i prilično zavise od drajvera ali i načina na koji je 3D aplikacija napisana. Međutim, AMD ima dosta iskustva kada su CrossFire rešenja u pitanju, a uz novi sistem „vezivanja“ grafičkih čipova, u kompaniji tvrde da će novi high-end „X2 akcelerator“ imati daleko bolje skaliranje performansi od prethodnika.
Šampion srednje-teške kategorije
Ako GPU možemo uporediti sa bokserima, onda je RV770 najsličniji Steve Collinsu, poznatom WBO šampionu najzanimljivije middle-weight kategorije: svestran, lukav i beskrajno zanimljiv GPU koji može da parira i konkurentu iz nešto više klase. AMD je uspeo da konkurentu donekre pokvari lansiranje GeForce GTX2xx serije kartica, jer su “slučajno“ procureli neki rezultati Radeon HD4800 serije kartica. Konkurentu nije bilo nimalo drago da vidi kako kartica koja će koštati oko 250 dolara ume često da bude i primetno brža od modela koji su tvorci GeForce brenda namenili za cenovni rang od 399 dolara. Ubrzo je najavljeno da će model GTX260 dobiti novu, za 50 dolara nižu cenu (iako bi, realno, spuštanje cene za 100 dolara bio logičniji potez), dok je GTX280 ostao u svojoj premium klasi koju će AMD „napasti“ za nekih mesec dana, kako se čini – zbog toga što je red da se i ljubiteljima Radeon kartica bez CrossFir ploča ponudi jedan akcelerator koji nudi izuzetne performanse. Međutim, i Radeon HD4850 je zasmetao NVIDIA-i, pa su, ubrzo, tiho lansirali GeForce 9800 GTX+ (iskreno, čudi nas da ga nisu nazvali GTX240), koji bi trebalo da košta 220 dolara, tj. tek nešto više nego pomenuti konkurent. Problem je, ipak, u tome što je Radeon HD4850, kao što ćemo i sami videti, malo brži od GeForce kartice koja je malo skuplja, pa se, u nešto manjoj meri, ponavlja priča koja važi i na relaciji Radeon HD4870 i GeForce GTX260. Radeon HD4850 je i tema našeg današnjeg testa, a ova kartica ima RV770 GPU koji je „klokovan“ na 625 MHz i 512MB GDDR3 memorije koja radi na nešto manje od 2000 MHz (efektivno) i prodaje se po preporučenoj ceni od 200 dolara (oko 140-150 evra na našem tržištu). Memorija sa GPU-om, pak, komunicira putem 256-bitne magistrale, ali o više detalja vezanih za RV770 ćemo pričati i to odmah.
RV770 GPU
Kao što smo već nagovestili, NVIDIA je u najvišoj klasi odlučila da igra sa tradicionalno velikim monstrum-GPU-om, kakvi su u svoje vreme bili i G80, NV40, NV30… (nećemo dalje). Jasno je da sa čipom od milijardu i četristo miliona tranzistora sa 512-bitnom memorijskom magistralom i gigabajtom memorije ne mogu da računaju da će popuniti cenovne razrede od 200 do 300 evra, pa je kompanija odlučila da još jednom vaskrsne G8… pardon, G92 GPU u vidu optical-shrink verzije ili, možda je primerenije – revizije, koja je nazvana G92b. Pošto znamo da 55-nm postupak služi da se smanji cena proizvodnje, a ne i da se (bitno) povećaju radne učestanosti, znamo i da daleko od nivoa performansi koje dostižu blago overklokovane GeForce 9800 GTX, a samim tim i GeForce 8800 GTS 512 kartice, NVIDIA u ovoj klasi neće ići. A, kako je Radeon HD4850 mnogo bolji nego što se očekivalo, postavlja se pitanje kada će se pojaviti i kako će izgledati prvi derivat GT200 čipa. Mi očekujemo da će neki manji GT2xx čip imati 256-bitnu magistralu, ali veći broj teksturnih i ROP jedinica nego što je imao G92, te da ćemo ponovo doći do čipa koji će u tom (kvantitativnom) smislu podsećati na G80 (ali sa savršenijim TMU jedinicama i boljim threading menadžmentom), ali će biti manji, jeftiniji i radiće na znatno većim učestanostima. Ovaj GPU bi morao da bude manji i jeftiniji od G92b ili bar jednak, ali solidno brži, jer, sa G92b, NVIDIA teško da može da bude dovoljno konkurentna RV770 rešenjima. Iskreni da budemo, za NVIDIA-u se preterano ne brinemo, jer će snaga brenda učiniti da se i nešto manje isplative GeForce kartice jedan solidan period prodaju i bolje nego što zaslužuju. GeForce jednostavno ima jak tržišni zamajac, koji bi adekvatni Radeoni zaustavili samo nakon nekoliko generacija prednosti kakvu sada RV770 ima u odnosu na G92b. Zbog čega ovo pričamo i kakve veze sada ima G92b i “šta može da bude” priča sa predstavljanjem RV770 čipa? Ima svake veze, jer upravo želimo da objasnimo koliko zapravo smatramo da je NVIDIA pogrešila što je dizajnirala naslednika G80 čipa, a ne nečega što bi nastavilo (pravi) put kojim je krenuo G92. AMD može biti konkurentan i GT200 rešenjima. Vrlo brzo će neki Radeon HD4870X2, a verovatno i HD4850X2 biti dovoljno jaki da mu se suprotstave: jači od njih će biti i brži od konkurenta, a jeftiniji će biti „tu negde“, ali će namamiti veliki broj kupaca povoljnom cenom; oprostite nam na spekulaciji, ali naša očekivana projekcija cena za ovakve kartice bi bila – 499 dolara za HD4870X2 i 349 dolara HD4850X2.
Ljubitelji grafike koji su očekivali da naslednik Radeon HD2900XT kartice bude, kao što je to ranije i bio red i običaj, znatno brži od svog prethodnika, bili su razočarani. HD3800 serija je i bila uspešna zato što je ponudila fantastične performanse u cenovnom rangu koji je skoro “za duplo” niži od onog u koji je inicijalno HD2900XT bio lansiran. Dual-GPU rešenje, HD3870X2 je vratio AMD u vrh, bar na kratko vreme, a oni koji su očekivali da i od njega, Radeon HD4800 bude značajno brži, opet su (možda) bili razočarani i oni će opet morati da sačekaju “X2 verziju”. Mislimo, pak, da je sasvim dovoljno da Radeon HD4850 kao kartica iz cenovnog ranga od 150 evra, bude po performansama vrlo bliska (a nekad i jednaka) Radeon HD3870X2 modelu. Više puta smo, tokom predstavljanja novih generacija velikih “monolithic” GPU-ova konstatovali kako se jaz između visoke, srednje i niže klase proširuje i kako najviše razlike u performansama pri predstavljanju nove generacije (u odnosu na staru) viđamo u najvišim segmentima. Tada smo primetili da mainstream klasa napreduje nešto sporije, dok kartice koje koštaju manje od 60 evra, ne napreduju gotovo uopšte (još uvek se koristi DDR2 memorija i 64-bitna memorijska magistrala, ali, ruku na srce, i njima je dodat moćan UVD engine). AMD-u moramo čestitati jer sa novom strategijom koju po drugi put primenjuje sa RV770, najviše unapređuje upravo mainstream segment, koji je i najbitniji za čitavu industriju. Ovakve igračke kartice se i uzimaju kao reper i minimum pri razvoju igara koje će se uskoro pojaviti. Upravo je Radeon HD4850 ta kartica koja je, primera radi, konačno omogućila da se Crysis, na Very High podešavanjima, igra u rezoluciji od 1440 x 900 ili 1680 x 1050 piksela (uz High podešavanja). Pre nego što se pojavila, ovu igru nije bilo moguće igrati na karticama koje koštaju 140 evra. Ni GeForce 9600GT, pre 4-5 meseci, a pogotovo GeForce 8600 GTS, u vreme kada se Crysis pojavio, nisu bili u stanju da igračima sa ovim budžetom omoguće takvo igračko iskustvo. Međutim, šta je sa rezolucijom od 1920 x 1200 i uključenim AA i AF filterima? Kako to da u ovoj rezoluciji ne možemo da igramo Crysis na karticama sa jednim čipom?
Za to su, svakako, potrebna – dva grafička jezgra. Nedavno smo bili svedoci trke koja se vodila kada su sistemski procesori u pitanju. Barijera od dva pa čak i tri gigaherza je probijena pre nego što se neko setio da procesor može imati dva jezgra. Sada je gotovo nezamislivo da neko želi ili misli da je logično da kupi jednojezgarni CPU koji radi na 4 GHz. Daleko je logičnije da sebi nabavi Quad Core koji radi na 2-3 GHz. Pa, i ako je problem da sadašnji softver optimizujemo da dobro iskoristi treće i četvrto jezgro sistemskog procesora, i grafička (igračka) 3D industrija ima problema sa skaliranjem više grafičkih kartica. Ali svi ti problemi će u nekom trenutku biti dovoljno minimalizovani da više neće privlačiti pažnju, a većini kupaca će biti normalno da kupuje Dual GPU kartice ili da u sistem postavi dva ili tri akceleratora, ako su mu neophodne više performanse. Do skoro je bilo logično da se prvo predstavi high-end GPU od koga će nastati derivat namenen srednjoj klasi, a onda i derivat koji bi zauzeo segmente od 50 do 100 dolara. Međutim, sa RV770, AMD je odlučio da kreira “derivate” i za višu i za nižu klasu. Klasičan “strip-down” GPU će biti napravljen za potrebe niže klase (verovatno 128-bit magistrala i manji broj shader i drugih jedinica nego što ih sada ima i RV670), dok se za višu klasu pravi klasično dual-GPU rešenje.
Arhitektura
Kao i prethodnik, RV770 je izrađen u istoj 55-nm tehnologiji, a za razliku od njega, koji se sastojao od 666 miliona tranzistora, novi GPU čini čak 956 miliona osnovnih semikonduktorskih elemenata, što je za ovaj proizvodni proces i površinu die-a u koji je spakovan, impresivna cifra. RV670 je imao površinu od 190 kvadratnih milimetara, a taj broj se povećao na 260 kvmm, što je opet vrlo prihvatljivo, čak i kada ga ne uporedimo sa sumanutih 576 kvmm koliko “zauzima” GT200 GPU. Prvi superkompjuter koji je nudio moć procesiranja od jednog teraFLOPS-a, izrađen je 1996. godine i sastojao se od skoro 10 hiljada (!!!) Intel Pentium Pro procesora na 200 MHz i trošio pola megavata struje uz obaveznih, dodatnih pola megavata koje je odlazilo, u isto vreme – na hlađenje! Samo dvanaest godina (što se, doduše, u IT industriji računa gotovo kao čitav vek) kasnije, AMD kreira grafičku karticu koja troši svega 110W a nudi istu processing moć! Nemamo informacije o tome koliko je 1996. godine koštao super-kompjuter ASCI Red, ali znamo da danas Radeon HD4800 košta svega par stotina dolara, pa i manje.
Shader, i…?
Radeon HD4800 GPU, po specifikaciji poseduje 800 stream processors jedinica, 40 TMU tj. jedinica za teksturni menadžment i 16 ROP procesora. Broj teksturnih jedinica je značajno povećan u odnosu na RV670 – sa 16 na 40, dok je broj render back-end unit-a ostao isti, što je i logično, s obzirom na magistralu koja je ka memoriji ostala na istih 256-bita. Kod jačeg modela, AMD to kompenzuje ultra-brzom GDDR5 memorijom, koja omogućava veći bandwidth i samim tim, adekvatno visoke performanse u opterećenim modovima, tj. u visokim rezolucijama. Razlika između modela 4850 i 4870 nije tako mala kao u slučaju Radeon HD3800 generacije. Novi “70-model” ima GPU koji radi na 20% višem taktu od “pedesetice”, dok je propusni opseg memorije na jačem modelu fantastičnih 80% veća! Zapravo, Radeon HD4870 sa 256-bitnom magistralom ima solidno veći bandwidth i od GeForce GTX260 kartice, koja koristi 448-bitnu magistralu. Osim prisustva GDDR5 memorije, Radeon HD4870 ima i prednost u odnosu na konkurente kada je “multimedia” u pitanju. RV770 poseduje osmokanalni LPCM zvučni kodek koji se ostvaruje putem HDMI veze.
Streaming processors jedinica kod RV770, kao što vidite, ima prilično mnogo, ali se one ne mogu u ovom obliku uporediti sa istoimenim procesorima kod G80 ili GT200 grafičkih čipova. Ako pogledamo dijagram SP jedinice, videćemo da je AMD zadržao njenu superskalarnu prirodu (NVIDIA i dalje koristi striktno skalarne jedinice). To znači da NVIDIA svoje jedinice naziva i broji kao 1-way skalarne procesore, dok AMD svaku od svojih “umnožava” sa pet, jer su u pitanju super-skalarne 5-way jedinice. O ovome smo opširnije pisali u našem prvom testu Radeon HD3800 kartica. Četiri segmenta svake SP jedinice kod RV770 čipa, dakle, obrađuju jednu floating-point operaciju po klok ciklusu (Multiple/Add), dok je peta sposobna za ovu skalarnu operaciju, uz mogućnost obrade jedne kompleksne specijalne instrukcije kakva je SIN, COS ili EXP. Svaka od jedinica radi u maksimalno FP32 (32-bit) formatu brojeva sa pokretnim zarezom, a uz njih, podsetićemo, stoji i posebna jedinica koja radi sa instrukcijama dinamičkog grananja, ali i set tzv. general purpose registers keš memorija, koje su slične deljenoj keš memoriji kod SP fragment procesora NVIDIA GPU-ova. AMD priča i o tome da je RV770 sposoban i za rad uz 64-bitnu preciznost (FP64), ali je tada teoretski processing maksimum na nekih 240 gigaFLOPS-a, što je opet skoro dva puta više od cifre koju je za GTX280 navodila NVIDIA. Ako neki od GP-GPU softverskih alata ikad bude zahtevao ovaj nivo preciznosti, videćemo koja će se od ove dve kartice i zaista bolje pokazati u realnom radu. SP jedinice su poređane u SIMD maniru (Single Instruction, Multiple Data) i to u vidu 16 blokova.
Svaki od 16 SIMD blokova poseduje osamdeset skalarnih SP jedinica koje podacima „hrani“ sada već poznati, ali poboljšani Ultra Threaded Dispatch Processor. Svako SIMD jezgro poseduje 16K sopstvene, deljene „keš“ memorije, kao i mogućnost međusobne komunikacije putem jedne posebne keš memorije (takođe 16K) kojoj svaki SIMD može da pristupa. Takođe, svaka SIMD particija ima i set od četiri teksturne jedinice (TMU), što novom AMD GPU-u daje shader : texturing odnosod 4 prema 1, dok ona kod GT200 čipa iznosi 3:1. Iako je NVIDIA ranije bila dosta konzervativnija kada je ovaj odnos resursa u pitanju (2:1 kod G80 i G92), izgleda da još nije pronađen balans koga bi se držala oba GPU dizajnera. Kada su poboljšanja na nivou Geometry Shader-a u pitanju, RV770 ima mogućnost da više generisanih podataka čuva u čipu pre nego što ih pošalje prema memoriji, uz četiri puta veći broj thread-ova u odnosu na prethodnika. Ovo je jako bitan podatak, jer su performanse geometry shader-a jako bitne za zdravu DirectX 10 funkcionalnost, a i napredni oblici tesselation metoda (sa kojima na je u primitivnom obliku upoznao još prvi Radeon GPU!) kroz DirectX 10.1 su još jedan dobar način da se poveća broj detalja na objektima uz uštedu u vremenu pri dizajniranju 3D scene, ali i uštedu u resursima GPU-a.
RV670 je imao manji problem pri prebacivanju režima rada sa integer na FP vrednosti, pa je njegov tzv. bit-shifter gubio po nekoliko klok-ciklusa pre nego što SP jedinice uposli za rad sa novim, drugačijim setom podataka. RV770 je u ovome i do 12.5x bolji, a kako ne možemo baš ovu tvrdnju tako lako da proverimo, ostaje da AMD-u verujemo na reč da se radi bar o približnoj cifri. AMD je takođe izračunao da su stream processing jedinice unutar novog GPU-a i do 40% bolje kada su u pitanju performanse po kvadratnom milimetru površine koju čip zauzima. Na kraju, možemo navesti i jednostavniju verziju priče – RV670 ima 64 5-way SP jedinice, RV770 ima 160 5-way jedinica, dok GT200 ima 240 1-way skalarna procesora koji, zauzvrat, rade na bar dva puta višem taktu u odnosu na one kod ATI procesora.
Ako želimo da, novi AMD GPU ipak uporedimo sa GT200 čipom i “prebrojimo” koliko koji GPU može da “izračuna” i koji su mu limiti, dolazimo do zanimljivih zaključaka. Broj registar bafer memorija u GT200 čipu, zbirno iznosi 1,88 MB, dok je kod RV770 ta brojka veća (2.5MB). Ovo je verovatno iznenađenje za sve one koji su videli koliko je GT200 veći od RV770 konkurenta. Maksimalan broj thread-ova koji se mogu obavljati po SIMD particiji je identičan i iznosi 1024, odnosno oko 30 hiljada po čipu za NVIDIA i oko 16 hiljada za ATI GPU.
Teksturne jedinice – TMU
ATI je sa R600 generacijom povećao odnos shader ALU jedinica prema onim koji su zaduženi za teksturni menadžment i to je jedan od razloga zbog koga za HD2900 kartice kažemo da su bile ispred svog vremena. Ovaj odnos je zadržan i kod RV670 GPU-ova, ali je nešto izmenjen kod poslednje generacije. AMD navodi da su performanse teksturne jedinice i do 70% veće kada se posmatra odnos performansi po milimetru površine GPU-a (i u odnosu na RV670). Kao što smo naveli, RV770 poseduje SIMD particije, a na svakoj od njih posebnu teksturnu jedinicu, od kojih svaka poseduje četiri ALU-a za adresiranje i šesnaest jedinica za sempling tekstura uz FP32 preciznost, kao i četiri jedinice za filtriranje u istom „režimu“. Broj SIMD particija je deset, što znači da RV770 poseduje 40 jedinica za adresiranje i filtriranje (tako dolazimo do brojke od „40 TMU-a“), kao i 160 jedinica za sepling u FP32 modu. Ako znamo koliko je TMU deo RV670 čipa slabiji, jasno je da od novog procesora možemo očekivati znatno bolje performanse, što će posebno biti vidljivo i u starijim igrama, koje se tradicionalno oslanjaju na multi-texturing, a manje na operacije sa shader-ima. Kada je pristup teksturama u pitanju, RV770 je još više „bursty“ (kako to Lord Huddy voli da kaže) nego prethodnik. L2 keš je postavljen bliže memorijskim „stanicama“ koje su direktno vezane za video memoriju, a svaka TMU jedinica na SIMD-u poseduje sopstvenu L1 keš memoriju, koja sa pomenutim L2 baferom komunicira brzinom od 384GB/s. L2 keš je izuzetno efikasan kada je pristup texture cache memoriji u VRAM-u u pitanju (čitavih 480GB/s je cifra koju AMD navodi). Veličine L1 i L2 keš memorija nam nisu poznate, ali znamo da su dva puta veće u odnosu na prethodnu generaciju, što teksturnu jedinicu RV770 čipa čini i do dva i po puta efikasnijom u filtriranju FP32 tekstura. Zanimljivo je da se AMD odlučio na to da TMU jedinice veže za SIMD, ali da instrukcijske i constant bafer memorije postavi na malo višu poziciju u „pajplajnu“, dok ih NVIDIA vezuje za SIMD. S druge strane, inženjeri kompanije iz Santa Clare su „izmestili“ TMU nešto dalje od SP jedinica, pa se ni u kojoj varijanti ne može reći da se nalaze u okviru istih segmenata GPU-a, iako pipeline kod Unified Shader GPU-ova nije kružan, niti jednosmeran, već se grana na velikom broju nivoa, a mnoge sub-jedinice mogu da komuniciraju međusobno, u zavisnosti od toga kakav se thread izvršava.
RV770, kao i prethodnik, podržava DirectX 10.1 verziju API-ja, tj. Shader Model 4.1. Nova podverzija Microsoft razvojnog okruženja, tj. interfejsa, direktno je kreirana oko specifikacije RV670 grafičkog čipa, ali je kod naslednika, ATI poradio dosta na poboljšanju Geometry Shader Engine-a. Najbitnije novine 10.1 verzije su podrška za cube map arrays koji omogućava poziv i upisivanje više cube map tekstura tokom jednog rendering ciklusa – funkcija koja je krucijalna za brži rad sa scenama u kojima je primenjeno globalno osvetljavanje (realtime global illumination), a koji izuzetno i značajno podiže realnost renderovane scene. Kontrola nad nezavisnim, hardverskim izvršavanjem antialiasing-a, koji je ATI predstavio na Xenos čipu, sada se direktnije kontroliše od strane same aplikacije upravo preko DirectX-a, što je stvar za koju je (ako nas pitate) bilo čudno što ranije nije bila podržana! Takođe, dodate su podrške za: ambient occlusion, gather 4, cube map arrays, sample pattern selection, pixel coverage mask i separate per-MRT (multiple rendering targets) blend modove. Ono što isto tako smatramo bitnim je i mogućnost da svaka aplikacija bude povezana sa posebno kreiranim antialiasing filterima (kao što developeri rade kada kreiraju igre za Xbox360) koje će Catalyst tim, nesumnjivo, obezbediti za bitnije naslove. Još jedna od novina koje su ponovo reaktualizovane, a bile su prisutne i kod RV670 zove se hardware tesselator i o njemu će biti više reči kasnije.
Render back-end i memorija
Jedan od problema sa kojim su se suočili testeri, ali i korisnici Radeon HD2900 i HD3800 serije kartica je definitivno vezan za performanse kada su uključeni algoritmi za umekšavanje ivica na objektima – tj. full screen antialiasing. Mnogi su to pripisivali suženoj memorijskoj magistrali, a opet, G92 tih problema nije imao, pa problem mora biti vezan za neku drugu manu RV670 čipa. RV770, zato, stiže sa unapređenom ROP, tj. render back-end jedinicom, koja je i zadužena za output pixel-a na ekranu, tj. za funkcije kao što je antialiasing. Međutim, ako RV770 opet ima četiri particije sa ukupno 16 ROP jedinica, baš kao i R600 i RV670, kako je moguće da su performanse ovog dela GPU-a, po kloku, bolje? Moguće je, jer je svaka ROP particija bar dva puta efikasnija od ROP-a kod prethodne generacije. RV670 je bio sposoban da prikaže osam piksela po kloku pri 2x ili 4x MSAA, dok RV770 može da „provuče“ šesnaest. Isti odnos važi i za 8x MSAA, s tim što je za oba GPU-a broj piksela po kloku dva puta manji. Broj stencil operacija nad pikselom je porastao na 64 (piksela po kloku), što je opet poboljšanje od 100%. RV770 ne donosi nove, snažnije AA modove, pa je ponovo maksimum postavljen na 8x za MSAA i Custom Filter AA algoritme, tj. metode umekšavanja ivica.
GDDR5 i memorijska magistrala
Sa R500 generacijom, ATI nas je upoznao sa RingBus memorijskim kontrolerom i odgovarajućom, kružnom memorijskom magistralom. Kružna, ne zato što vodovi između RingBus stanica, tj. delova kontrolera imaju kružni oblik, već zato što mogu i međusobno da komuniciraju i to dva puta širom magistralom nego što je ona prema memorijskim čipovima, pa je tako bilo lako da se interno njom “voze” podaci brzinom od čak 100 gigabajta po sekundi. RingBus je odličan pristup kada se barata sa ogromnim paketima podataka, ali se jednako koristi i kada je GPU opterećen samo delimično, kao npr. tokom gledanja filmova (kada je UVD aktivan) ili kada se radi u 2D režimu. U vreme koje ponajviše obeležava i takmičenje za što višom energetskom efikasnošću, tradicionalan RingBus je sličan Boeingu 747 koji pedesetak putnika vozi od Beograda do Tivta. Kod RV770, memorijskom kontroleru je dodat manje robustan, ali dosta štedljiviji switched hub, koji ne može da šalje pakete podataka dvosmerno, ali zbog svoje direkcione prirode, ima ukupnu širinu od čak 2048 bita, pa se zato propusna moć povećava na 192GB/s, ali se samo jedan njegov mali deo koristi, kada je to potrebno. Uz više radne frekvencije, nemogućnost kružnog putovanja podataka bi trebalo da bude kompenzovana, a latencije su dodatno smanjene, jer određen broj paketa u nekim situacijama neće putovati dužim delom „kruga“. Takođe, „izbacivanje“ RingBus-a je dovelo i do uštede u broju potrebnih tranzistora – „prsten“ ima svojih prednosti, ali je prilično zahtevan kada je die u pitanju. AMD se, dakle, vratio klasičnom crossbar memorijskomkontroleru od koga NVIDIA nikad nije ni odustala. Međutim, AMD-ov crossbar podržava GDDR memoriju treće, četvrte i pete generacije, a već smo ostali zaprepašteni efektivnim radnim taktom najbržih GDDR5 čipova.
GDDR3 je prilično „odomaćen“ standard – tu je još od vremena GeForce 6800 kartica, a u mainstream se preselio već u samom startu karijere (GeForce 6600GT modeli). GDDR4 je nekako ostao „rezervisan“ za ATI kartice, jer ga NVIDIA praktično nije ni koristila na svojim akceleratorima. GDDR5 će, pak, biti prevelik korak unapred čak i za arogantnu kompaniju kakva je Chipzilla, da je ignoriše. Da li čitava priča oko ne-usvajanja GDDR4 standarda od strane NVIDIA-e ima veze sa tim što je jedan od glavnih ljudi koji se bavi „guranjem“ ovog standarda unapred, člana JEDEC „komisije“, gospodin Joe Macri, radi u AMD-u, nismo sigurni, ali čak i da u tome ima samo trunka istine, složićete se da to zvuči veoma interesantno.
Šta novo donosi GDDR5? Prvenstveno, omogućava više radne učestanosti i bolji propusni opseg, ali to smo i očekivali. Odmah usvojen od strane JEDEC-a i glavna tri proizvođača memorije (Samsung, Qimonda i Hynix), GDDR5 je pažljivo razvijan već godinama unazad, a GDDR4 je poslužio samo kao „faza“ da se dostigne ono što će nuditi „petica“. Verovali ili ne, sa gospodinom Joe Macrijem smo diskutovali na temu GDDR5 memorije (radnim učestanostima, naponima i propusnom opsegu) još 2006. godine, kada je ATI, na Ibizi lansirao Radeon HD2xxx familiju kartica. I što vam može zvučati još neverovatnije je i da je tada g. Macri naveo da se na GDDR5 memoriji radi već preko 18 meseci. Nova memorija donosi veći „bandwidth po pin-u na layout-u čipa“, a naravno i veću propusnu moć uopšte. GDDR4 je maksimalno mogao da postigne 4GB/s po pin-u, dok GDDR5 može do osam, što znači da uparivanje GDDR5 memorije na 256-bitnu magistralu daje iste rezultate kao i upotreba GDDR3 memorije na 512-bitnom bus-u. GDDR5 ima i logiku koja omogućava „samo-adaptaciju“ latencija i tajminga za rad sa određenim tipom procesora. GDDR5, kao i GDDR4 poseduje naprednu detekciju grešaka, a svaki čip sada poseduje i termalni senzor koji nadgleda radne temperature i skokove napona. Adaptacija koju smo pomenuli nije neki komplikovani kod koji se izvršava in-hardware, već samo obezbeđuje bolju kontrolu izvoda na čipu, tako da više nije neophodno da se trace-ovi na PCB-u rutiraju na poseban način kako bi se postigao dovoljno „čist“ signal. Umesto toga, svaki modul se prilagođava svojim „putevima“ prilikom svakog novog dizanja sistema. Naponi koji se koriste kod GDDR5 memorija su oko 30% niže od onih kod GDDR3 standarda i blago više u odnosu na GDD4.
Tessellation
Kao što smo i gore napomenuli, hardverski tesselation tj. usložnjavanje 3D objekata pomoću logike samog GPU-a je nešto o čemu nismo pošteno diskutovali još kako je izašao R200 GPU (pogađate, to je ATI Radeon 8500). Nekadašnji TRUFORM je i NVIDIA nekada inicirala sa svojim verzijama higher order surfaces, dok je Matrox prošao neslavno sa svojim displacement mapping tehnikama i prvom generacijom Parhelia kartica. U vreme kada je razvijan R600 i kada je ova priča mogla da dostigne punu i konkretnu zrelost i bude podržana unutar API-ja, ATI je kreirao i sopstveni tesselator engine, o kome do sada nije preterano pričao iako ga poseduje i RV670 GPU. Na proleće prošle godine, AMD je predstavio programirani tesselator kroz upotrebu odgovarajućih vertex shader rutina, ali ne i DirectX 10 geometry shader-a, što je i bilo logično i zbog čega je i inicijalan zamajac za ovu tehnologiju izostao. Zapravo, prva generacija tesselation engine-a kod R600 je preuzeta iz nešto starijeg Xenos GPU-a (Xbox360 GPU i northbridge) i on može da se programira samo pomoću standardnih vertex shadera, dok je tesselator u okviru RV770 poboljšan i prihvata i geometry shader koji je i logičan za rad sa ovakvim tehnologijama. Kako bi demonstrirao svoju tehnološku superiornost – DirectX 10 tesselation engine i instancing koji rade pomoću geometry shadera DX10 API-ja, ali i global illumination, AMD je angažovao tim developera i Natashu Tatarchuk, koja je kreiran je demo koji je nazvan Froblins. Male kreature, njih na hiljade (instancing), na ogromnom prostranstrvu, svaki osečnen “globalno” (GI), sa ogromnim brojem detalja (tesselation), na kompleksnom terenu (geometry shader) i razmišlja za sebe (GPU pathfinding)… ovo je prvi put da GPU kroz DirectX 10 učestvuje i u kalkulaciji veštačke inteligencije!
Unified Video Decoder engine 2.0
Prva generacija AMD Unified Video Decoding engine-a (Richard Huddy me je već jednom ispravio jer sam ga nazvao Universal, ali izgleda da ga tako svi i dalje nazivaju i ne obaziru se na ono što piše u tehničkoj dokumentaciji – prim. aut.) je već dovoljno savršena i o njoj smo više puta pisali. NVIDIA grafičkih procesori od G84 na ovamo, kao i nova familija Radeon HD2000 (bez 2900XT i Pro modela) i HD3000 akceleratora imaju posvećeni video processing engine koji ATI naziva Unified Video Decoder. U odnosu na AVIVO, UVD je napredovao koliko i PureVideo HD druge generacije u odnosu na rešenje iz GeForce 7 familije, a nakon njegovog izostanka ili nefunkcionalnosti kod R600 kartica, našao je svoje mesto kod aktuelne HD3800 serije. AMD tvrdi da je smanjenje CPU utilizacije pri posmatranju H.264, a posebno VC-1 video formata, koji su postali standardni video kodeci za BluRay naslove zaista vredno pažnje, čak i na desktop sistemima. Prilikom obrade HD video signala, pred grafičkom karticom stoji izazov koji se ne završava samo na procesiranju bar 6x više informacija u odnosu na video signal standardne definicije. Jednostavno rečeno, grafičke kartice poseduju specijalnu logiku koja im objašnjava kako da brojne shader jedinice iskoriste za obradu video signala. Pošto su GPU-ovi sve moćniji, zbog čega stati na 1080p rezoluciji? AMD je proširio podršku i za XHD rezolucije, što nam nije teško da zamislimo jer, ako ove kartice bez problema rade sa stotinama tekstura visoke rezolucije koje “lepe” na hiljade poligona u 3D igrama, zbog čega ne bi mogle da, tridesetak puta u sekundi, nalepe jednu “teksturu” na jednu površinu na ekranu. Naravno, jasno je da se na tu “teksturu” primenjuju malo zahtevniji algoritmi od običnog trilinear ili anisotropic filtera, brinuti o daljem toku podataka, korekciji i kompenzaciji pokreta, de-interlacing-u i tome slično, ali je sve to, složićete se, i dalje manje kompleksan “shader program” od “sličnih” rutina u modernim igrama.
Početne BitStream i Entropy Decode faze se sada izvršavaju od strane GPU-a. UVD je kreiran da u potpunosti dekodira i najzahtevnije (i najnaprednije) video kodeke kakvi su VC-1 i H.264, uključujući i bitrate od 40 Mbps ili više i koristi već postojeća, programabilna SIMD jezgra, odnosno Stream Processors jedinice. Ono što novi Radeon HD4800 GPU-ovi podržavaju, a od nedavno i konkurencija sa novim GPU-ovima, naziva se full-speed CABAC i CAVLC dekodiranje u okviru H.264 i VC-1 kodeka. Sav postprocessing se obavlja unutar shader jedinica, uz primenu filtera koji su ništa drugo do namenski kreirani shader programi koji se u potpunosti izvršavaju in hardware. HDMI, odnosno High Definition Multimedia Interface je u potpunosti podržan od strane RV670 GPU-a, zajedno sa obaveznim HDCP (High-bandwidth Digital Copy Protection) sistemom zaštite od kopiranja. Osim digitalnog signala, HDMI konektor “prenosi” i više kanalni audio zvuk, koji RV770, kao i RV670 i R600, podržava. Kod prethodnika je to bio 5.1, 16-bit PCM Stereo ili kompresovani AC3 5.1 više kanalni audio-stream po Dolby Digital i Dolby DTS standardima, ali je to kod RV770 dovedeno na viši nivo – sada je podržan osmokanalni (7.1) audio uz maksimalan bitrate od 6.144 Mbps i sempling od 192KHz. Podrška za “filmske” formate se ne zaustavlja na Dolby DTS i Digital standardima – tu su sada i True-HD i DTS HD formati u koje se “slažu zvučne slike na novim BluRay izdanjima. Novina je i podrška za DisplayPort interfejs iz samog čipa.
Još jedna od bitnih novina je i mogućnost dual-stream plejebeka, pa RV770 može da pusti dva HD video feed-a i to u modu “slika-u-slici” sa kompletnim de-kodiranjem kroz VC-1, H.264 i MPEG-2 (uz upscaling DVD formata u HD rezolucije i nove profile sa dinamičkim kontrastom). AMD će uskoro na websajt pustiti i novu aplikaciju Accelerated Video Transcoding koja će omogućiti transkoding HD video formata u MPEG-2 ili H.264 i to oko 19 puta brže nego Intel Core 2 Duo E8500 CPU (mereno za klip u 1080p rezoluciji). Ovaj algoritam će se pojaviti i u obliku plug-in-a za Cyberlink's PowerDirector aplikaciju, a ubrzo i druge popularne programe.
Ekološki procesor, GP-GPU i drugi noviteti
Prvi štedljivi i balansirani GPU kompanije AMD je svakako bio R670, tj. Radeon HD3800 grafički procesor, pa su ove procesore lansirali gotovo u isto vreme i u mobilnim varijantama (Radeon Mobility HD3000). I Radeon HD3870 nudi impresivan power management i dosta uštede kada je u idle režimu, a sa Richardom Huddy-jem smo pričali i o tome da sam GPU poseduje više performance stanja. RV770 poseduje in-GPU kontroler koji prati temperature i opterećenost shader blokova GPU-a, kao i PCI Express magistralu. Kada zaključi da opterećenje nije visoko, clock gating praktično isključuje čitave delove GPU-a koji u tim ciklusima nisu potrebni. Lord Huddy nam je, na pitanje “Da li se u tom slučaju nekoliko ciklusa izgubi, pre nego što se GPU probudi i potpuno “profunkcioniše”, odgovorio potvrdno, ali s obzirom na takt od 600 i više miliona ciklusa u sekundi, teško da postoji načn da se ti gubici mogu izmeriti, a kamoli primetiti. Ista kontrolna logika vodi računa o radnim učestanostima, temperaturi i naponu GPU-a te “govori” ventilatoru na kom broju obrtaja treba da hladi karticu.
Pisali smo o NVIDIA GP-GPU inicijativi i koliko se njihov pristup razlikuje od dosadašnjih general purpose inicijativa koje su se mahom oslanjale na grafički API, a ne na potrebu programera da prekompajliraju softver u CUDA okruženju (ekstenzija programskog jezika C). Stream Computing je ATI-jev naziv GP-GPU inicijative koja omogućava da se standardni softver na pravi način izvršava na GPU-u i iskoristi njegove jezivo velike parallel processing resurse. AMD se, pak, oslanja na kompaniju Apple i njihovo interesovanje u smeru OpenCL ekstenzije programskog jezika koji je po sintaksi takođe sličan popularnom “Ce-plus-plusu”. Najčudnije od svega je što se pred pripremu ovog teksta pojavilo dosta potvrđenih informacija i vesti o tome da Radeon HD4800 kartice sasvim lepo rade sa CUDA aplikacijama i da su čak vrlo konkurentne NVIDIA GT200 akceleratorima. O GP-GPU inicijativi kompanije AMD još uvek ne može mnogo toga da se kaže, ali su tokom predstavljanja novog GPU-a ispred kompanija Adobe pričali o konkretnom rekompajliranju Photoshop CS4 softverskog paketa za dve, do tri standardne GP-GPU tehnologije. I na kraju, pomenućemo da RV770 podržava CrossFire i CrossFire X za vezivanje dve, tri ili četiri grafička jezgra u jedan sistem, ali ćemo i ovoj temi više pažnje posvetiti nekom narednom prilikom (kada se pojavi Radeon HD4870X2).
Kartica na testu – MSI RX4850
Kartica sa oznakom MSI RX4850 čuvenog proizvođača koji našim čitaocima ne moramo posebno predstavljati, do nas je stigla uz punu propratnu opremu: uputstvo, disk sa drajverima i dodatnim softverskim video plejerom, kao i DVI -> D-Sub adapter, DVI -> HDMI adapter, 2xMolex -> PCI-e kabl, S-video -> Composite spliter, HDTV razdelnik i CrossFire mostić. U paketu je i DVD Multimedia softver, a nedostatak DVD plejera ćemo oprostiti jer su u paketu igre Lord of the Ring Online (MMORPG 15-day trial), kao i Colin McRae DiRT. Ipak, od MSI-ja smo dobili informaciju da samo ovi “test primerci” kartice stižu sa ovom igrom, te da će u prodaji primerci ove kartice stizati sa igrom Rainbow Six Vegas 2.
MSI RX4850 je setovan na 625 MHz, a 512MB GDDR3 memorije na 993 MHz, tj. efektivnih 1986 MHz. Kako se radi o kopiji referentnog modela, koji je karakterističan po single-slot hladnjaku koji je izrađen od bakra, i MSI kartica ume poprilično da se zagreje. Ako mislite da se GeForce 8800 GT zagrevao, sačekajte da vidite kako to radi Radeon HD4850. Temperatura u stanju mirovanja je nekad dostizala i blizu 80 stepeni i to kada je klima bila uključena, ali, ruku na srce – u malom WaveMaster kućištu. Ne smemo ni da pogledamo koliko se GPU zagrevao tokom 3D režima, mada su kolege navodile da ni 110 stepeni, nakon kojih procesor kreće sa throttling-om, nije bila retko viđana pojava. Očekujemo, zato da partneri krenu da ugrađuju ozbiljnije kulere, jer je čak i jeftini Zalman-ov VF900 Orb odlično rešenje, obzirom na to da se memorija ne greje previše. Sa druge strane, čak ni referentni kuler nije previše bučan. Štaviše, koliko je kartica vruća, začudili smo se što je toliko tih – očigledno je problem u internom “menadžmentu” i odnosu pragova temperature i broj obrtaja vetilatora.
Referentni model ima naizgled manje komplikovanu naponsku jedinicu nego prethodnik, ali je to zbog toga što je ona pretežno „digitalna“ i sastoji se od PWM elemenata. Nedavno se pojavio i novi BIOS za generičke modele koji donosi nove vrednosti za brzinu obrtaja ventilatora, pa ako ste vični flešovanju istog, ovo se preporučuje, mada su sve šanse da ako planirate da kupite karticu, već i uzmete verziju sa novim BIOS-om. Napon na kome radi RV770 GPU kod HD4850 kartica se kreće oko 1.067 do 1.083V, a na modelu HD4870 je podignut na čak 1.327V, ali ovaj model ima značajno bolje hlađenje. Zapravo, na sporijem modelu postoji mali problem sa pregrevanjem, pa nikako ne preporučujemo da karticu dodirnete na mestu gde je bakarni kuler, pogotovo tamo gde su toplotne cevi. Kuler Radeon HD4850 modela je jako sličan onom koji smo viđali kod referentnih Radeon HD3850 kartica, što je čudno jer je ipak RV770 znatno veći GPU od svog prethodnika. Pa ipak, razlike kod kulera postoje, jer noviji ima drugačije profilisan ventilator sa 19 listića, kao i radijator sa mnogo više kružno postavljenih rebara. Veliki deo kulera je načinjen od aluminijuma finiširanog tako da liči na bakar, ali je zapravo su samo baza koja dodiruje GPU, ali i toplotne cevi, načinjene od ovog metala. Kartica koristi GDDR3 čipove koje je isporučila kompanija Qimonda (bivši Infineon), a nose oznake koje se završavaju sa BF-10, što označava latenciju od 1.0 ns ili 1000 MHz (2000 MHz DDR).
Kako Radeon HD4870 koristi daleko brži GDDR5, retko koji će se Radeon HD4850 ikad približiti onome što nudi “sedamdesetica”. Kartica poseduje dva DVI porta, što je najstandardnija moguća varijanta u poslednjih nekoliko godina, a prava je šteta što nema HDMI priključka, iako cenimo to što ga MSI daje uz sve Radeon HD3000 i HD4000 kartice srednje i više klase koje smo testirali. Na karticama je vidljiv i CrossFire X priključak koji omogućava da dve, tri ili četiri iste kartice povežete u MultiGPU režim radi daleko viših performansi. Takođe, da bi kartica radila, neophodno ju je povezati na eksterni 6-pinski konektor. Malo nam je čudno to što MSI nije u startu ponudio overklokovani model Radeon HD4850 kartice, dok u klasi HD4870 već sada ima dva modela, od kojih je do nas stigao referentni, ali overklokovani primerak…
Kartica na testu – MSI RX4870
Prva Radeon HD4870 kartica koju smo testirali, stigla nam je od kompanije MSI i identičan je referentnom modelu. To znači da se od drugih, sličnih „kolega“ razlikuje samo po nalepnici, a da je rashladni sistem koji ćemo i sada opisati, isti kao i na većini ovih kartica. Propratni paket je identičan onom kod prethodno testirane kartice, što znači da su tu DVI -> D-Sub adapter, DVI -> HDMI adapter, 2xMolex -> PCI-e kabl, S-video -> Composite spliter, HDTV razdelnik i CrossFire bridge. U paketu je MSI Multimedia softver, te igre Lord of the Ring Online (MMORPG 15-day trial) i Tom Clancy’s Rainbow Six: Vegas 2 (na našem primerku je to još uvek bio stari dobri CMR: DiRT (možda bi bilo bolje da je ova trka zamenjena sa novim Race Driver: GRID-om, mada ni „Vegas 2“ nije za bacanje).
MSI RX4870 je kartica sa dual-slot hladnjakom koja koristi isti RV770 grafički čip kao i slabiji brat – HD4850. PCB je identične crvene boje i po rasporedu komponenti, tj. layout-u, deluje jako jako slično slabijem modelu. Najveća razlika, ako zanemarimo malo moćniju naponsku jedinicu i DDR5 memoriju, je u kuleru, koji je kod jače kartice daleko ozbiljniji, što je i logično za model koji radi na višim učestanostima, ali i radnim naponima. Pošto je kuler prilično masivan, a sam PCB nije previše debeo (kao kod high-end NVIDIA kartica), oko rashladnog sistema se nalazi „prsten“, tj. zid koji osigurava i pričvršćuje osetljivu višeslojnu štampanu ploču od izvijanja koje bi moglo da nastane usled visokih temperatura i velikog pritiska samog kulera (metal od koga je načinjen se stalno zagreva i hladi i to neravnomerno, tako da bi mikro aberacije dimenzija pojedinih delova mogle, nakon određenog vremena, da dovedu do oštećenja vodova u PCB-u).
Samo mesto na kome kuler dodiruje GPU, na njegovim ivicama, posebno je ojačano i precizno obrađeno kako bi bakarni umetak na donjoj strani na najbolji način legao na površinu jezgra. Sam rashladni sistem se ne razlikuje mnogo, bar ne po konceptu, od onog kod Radeon HD3870 kartica. Bakarna baza koja dodiruje jezgro i memoriju je drugačijeg oblika (GPU je veći, a raspored memorijskih čipova drugačiji) i bolje je ispolirana od one kod referentnog kulera kartice prethodne generacije). Princip funkcionisanja se nije promenio – ventilator uvlači hladniji vazduh u tunel u kome se nalaze zagrejani listići koji su preuzeli toplotnu energiju sa baze kulera. Toplotna energija se predaje vazduhu koji velikom brzinom prolazi kroz tunel i izlazi van kućišta, što je vrlo bitan detalj i što je jedna od osnovnih razlika u odnosu na single-slot kulere koji umeju da zagreju unutrašnjost sistema (temperaturu matične ploče, pa čak i samog procesora). Takođe, dual slot kuleri su često i tiši od onih užih, „jednoslotnih“. Čak i naponska jedinica ima posvećeni hladnjak koji je spojen sa ostatkom kulera.
Kuler je načinjen od kombinacije metala: baza je od bakra, dok je glavni radijator sa listićima načinjen od aluminijuma. Za bolju distribuciju toplotne energije, u sistem su dodate i dve heat-pipe „cevke“. MSI RX4870 ima dva dual-link DVI porta i jedan S-Video izlaz. HDMI konekcija se ostvaruje putem posebnog adaptera, kroz koji „prolazi“ i 7.1 zvuk. Takođe, na kartici uočavamo dva Crossfire konektora za Crossfire X sisteme (3 ili 4 kartice na posebnim pločama), a pomenućemo i da kartica ima dva šestopinska PCI Express konektora za eksterno napajanje. Kao što smo i napomenuli, HD4870 koristi istu verziju GPU-a kao i HD4850, a i sama revizija je ista. Međutim, kod slabijeg modela, on je klokovan na 625 MHz, dok je kod jačeg ubrzan na 750 MHz. Memorija GDDR3 tipa, kod HD4850 kartica radi na 900 (1800) MHz, dok kod HD4870 modela, GDDR5 čipovi imaju nominalnu frekvenciju od 1000 MHz, ali s obzirom na to da se radi o Quad-Data-Rate čipovima, efektivan takt je 4 GHz.
Na referentnom modelu Radeon HD4870 kartice, ova memorija je podešena na 900 (3600) MHz. No, MSI ne bi uživao tako visok renome da nema i ponudu za one koji žele još više. Njihova RX4870 kartica ima nešto više radne učestanosti: GPU je ubrzan na 780 MHz, dok je memorija „klokovana“ na čak 4 GHz, što je i preporučeni maksimum za Qimonda IDGV51-05A1F1C-40X GDDR5 čipove (40x označava “4 Gbit-a po pin-u”). Ovo omogućava još viši memorijski bandwidth, te u tom smislu, Radeon HD4870 možete posmatrati i kao karticu koja ima GDDR3 memoriju na taktu od 900 ili 1000 MHz, ali sa 512-bitnom memorijskom magistralom. AMD je ovoga puta povukao pravi potez – GDDR5 na taktu od 1000 MHz sa 256-bitnom magistralom, pruža isti bandwidth kao i GDDR3 na 1000 MHz, ali na 512-bitnoj magistrali. Svi znamo koliko PCB poskupljuje kada GPU ima 512-bitnu magistralu… MSI RX4870 kartica, kao i RX4850, rade savršeno stabilno, iako umeju prilično da se zagreju (HD4870 za nijansu manje) kada su pod punim opterećenjem.
Test Setup
PCI Express kartice smo testirali na test sistemu prikazanom u tabeli:
Procesor
Intel Core 2 Quad Q6600 @ 3600 MHz (400 MHz x 9), 1600 MHz QPB
Matična ploča
ASUS P5K Premium Black Pearl 18th Anniversary Edition
Memorija
2 x 1Gb Geil PC2-8500 1066GHz @1200MHz 2.25V
Hard Disk
Samsung SpinPoint SATA II, 320 GB, 16MB
Western Digital Caviar 2500JS SATA II 250 GB, 16MB
Video Karte
Gainward Bliss 8800 GT – (512MB DDR3) – Forceware 169.28
Gainward Bliss 8800 GTS 512 – (512MB DDR3) – Forceware 169.28
GeForce 9800 GTX (768MB DDR3) – Forceware 175.19
MSI N280GTX OC- 1024 MB DDR3 – Forceware 177.39, 175.19
Gigabyte GeForce GTX280 – Forceware 177.39
ASUS EAH3870 X2 (1024MB DDR3) – Catalyst 8.2b
Sapphire Radeon HD4850 512MB (512MB DDR3) – Catalyst 8.6
MSI RX4850 512MB (512MB DDR3) – Catalyst 8.7
MSI RX4870 OC 512MB (512MB DDR5) – Catalyst 8.7
Monitor
Samsung SyncMaster 244T / 245T
Cooling, Case, PSU
CoolerMaster GeminII
CoolerMaster Stacker 832 / WaveMaster
CoolerMaster Real Power 850W SLI & CrossFire Certified
DVD uređaj
Pioneer DVR-112L
DVD uređaj
Pioneer DVR-108D
Operativni sistem
Windows XP Service Pack 2 (optimized for performance)
Windows Vista (default)
DirectX 9.0c
DirectX 10
Igre/Bench programi
3D Mark Vantage
3D Mark 06
SPECORG SpecVIEW Perf 8.1
Doom 3
Quake 4
Prey
Company of Heroes 1.3
Battlefield 2142
Unreal Tournament 3
Lost Planet: Extreme Conditions
Call of Duty 4: Modern Warfare
Half Life 2: Episode Two
FarCry v1.4
Crysis Demo
The Elder Scrolls IV: Oblivion
Need For Speed: Carbon
X3 Reunion Demo Benchmark
World in Conflict
S.T.A.L.K.E.R
F.E.A.R 1.08
ATI kartice smo testirali sa Catalyst A.I podešenim na Standard. Ako je AF bio uključen, to je podrazumevalo Quality setting, dok su Adaptive i Temporal anisotropic filtering bili isključeni. Wait for vertical refresh odnosno Vertical Sync smo isključili. Kod nVidia kartica, podrazumevani mip-map setting je Quality, trilinearne optimizacije su uključene, anisotropic mip filter i sample optimizacije isključene, a gamma correction pri antialiasingu uključen. S obzirom na to da se NVIDIA kartice testiraju sa teksturnim filterom podešenim na High Quality (default je Quality), dobijeni rezultati su možda niži u odnosu na rezultate koje bi neko drugi mogao da dobije na sličnom test sistemu.
FutureMark 3DMark 06 Pro
Novo izdanje 3DMark benchmarka može da se izvršava samo sa Direct X 9 kompatibilnim akceleratorima. Tri prerađena testa iz prošlogodišnje verzije koriste Shader Model verzije 2.0, dok najnoviji zahteva SM3.0 i 256 MB video memorije Sva tri game demoa su izuzetno zahtevni, karakteriše ih još veći broj poligona koji opterećuje VS jedinicu, kompleksni shader programi (mapiranje neravnina, osvetljenja, emulacija pravog HDR osvetljenja, particle efekti, dinamične i meke senke, subface scattering, napredni fog efekti (emulacija volumetric efekta), ali i dosta postprocesing efekata. Novi test – Deep Freeze je grafički najimpresivniji, a novi 3DMark ima i napredni CPU test, koji simulira upotrebu A.I. rutina u igrama, kao i kalkulacije vezane za samu fiziku.
FutureMark 3DMark Vantage
Iako nije toliko vizuelno impresivan kao njegovi prethodnici, 3DMark Vantage je zapravo dosta bolje osmišljen GPU i gaming benchmark uopšte. Pažnja je ovoga puta usmerena na funkcije koje se izvršavaju ili će se uskoro izvršavati unutar igračkih “endžina”, a ne na sam artwork. Prvi od dva grafička testa, Jane Nash (Graphics Test 1) testiraju simulaciju tečnih povšina i generisanih tekstura, kao i GPU-kalkulisane sisteme čestica, a u čitavoj sceni se u realnom vremenu u obzir uzimaju i uticaj gravitacije na objektima (pa i na “objektima” glavne junakinje), zakon inercije i impulsa sile (prva dva Njutnova zakona), kao i zakon akcije i reakcije, uz uticaj otpora vazduha. Fiziku kalkuliše GPU, a da sve ne bi ostalo samo na kalkulacijama “ispod”, 3D scena je opterećena brojnim dinamičkim izvorima osvetljenja sa kompleksnim senkama, a voda, koja je refleksivna i refraktivna, se ne pomera na predefinisan način, već se svaki talas u realnom vremenu i dinamički generiše. Drugi test, New Calico, podseća na igru X3:The Threat i ne sadrži objekte sa skinovima (bez zglobova), ali zato poseduje ogroman broj objekata u sceni, sa shadow mapama različitog tipa. Po prvi put u 3DMark benchmark programu, prisutni su i global raytracing efekti ((Parallax Occlusion Mapping, True Impostors i volumetric fog). Treći test pokušava da izmeri performanse CPU-a u kalkulacijama veštačke inteligencije i fizike. Broj “gejtova” kroz koje proleću avioni je srazmeran broju jezgara sistemskog procesora, a ako u sistemu posedujete i hardver za kalkulaciju fizike (PPU), ovaj broj se povećava za tri. Nakon, standardnih, na red dolaze i “sintetički” testovi: texture fillrate, color fillrate, paralax occlusion mapping, gpu clothing, particles, noise…
SpecORG SpecVIEW Perf 8.1
Koristili smo poslednju aktuelnu verziju koji se sastoji od čak osam celina. SpecviewPerf meri performanse sistema pod OpenGL API-jem tako što simulira osam standardnih industrijskih aplikacija. 3Dsmax-03 je bayiran na SPECapc za 3dS MAX u OpenGL okruženju. U sceni su tri modela sastavljena od po približno 1.5 miliona vertices-a, a testiranje se vrši uz nekoliko tipičnih tipova osvetljenja. Catia-01 je bazirana na Dassault CATIA inžinjering aplikaciji u kojoj modeli imaju do dva miliona osnovnih linija. Ensight-01 je simulacija CEI EnSight inžinjering aplikacije koja se koristi za vizuelizaciju. U test su ubačeni displej-list i fast preview modovi rada. Light-07 je baziran na Discreet-ovoj Lightscape aplikaciji koja koristi realtime radiosity senčenje. Maya-01, kako joj i samo ime govori, simulira radno okruženje paketa kompanije Alias – Maya 5, nezamenljivi alat filmadžija u Holivudu. Proe-03 je baziran na SPECapc okruženju za Pro-Engineer 2001, koji u sceni primenjuje dva modela u tri shade moda (senčeni, wireframe i hidden-line removal). SW-01 simulira Solidworks 2004 aplikaciju, koju izdaje Dassault Systems i konačno, test Ugs-04, baziran na SPECapc Unigraphics V17 aplikaciji (odnosno simulaciji iste), u kojem je prikazan model motora sastavljen od preko četiri miliona osnovnih linija.
Lost Planet: Extreme Condition
Lost Planet: Extreme Condition je za Xbox360 izašao početkom 2007 godine, a nešto više od godinu dana kasnije, pojavio se i u verziji za Windows XP i Vista platformu sa podrškom za rad kroz DirectX 9 i DirectX 10 API-je. Kao i u verziji za Xbox360, poseduje veliki broj “next-gen” efekata, uključujući i filmske efekte poput full-frame motion blur-a, depth of field-a, a posebno se ističu napredni particle efekti koji verno oslikavaju žestoke zimske uslove, vatru, paljbu iz futurističkog oružja i sl. Na Microsoft konzoli radi u 720p rezoluciji sa oko 30-35 fps, ali kako podržava više radne rezolucije na Windows platformi (rezolucije tekstura, poligoni i sl. su identični Xbox360 verziji), predstavlja dosta dobar alat za testiranje novih grafičkih kartica. Iako gotovo tri godine nakon što je završena, igra po današnjim standardima ne izgleda impresivno, ume da bude prilično zahtevna. Mi smo testirali kroz prvi “built-in” test, uz maksimalan nivo detalja, u DirectX10 okruženju pa pogledajmo rezultate:
Call of Duty 4: Modern Warfare
Za razliku od prethodnika, Call of Duty 4: Modern Warfare igrača postavlja u okršaje novijih datuma. Baziran je na unapređenom “motoru” svojih prethodnika, posebno verzije iz trećeg dela, koji se pojavio isključivo u verziji za Xbox360 konzolu. Iako smatramo da bi rezultati koje daje sa današnjim hardverom (kraj 2007. godine) mogli biti veći, ipak je u pitanju dobro optimizovana igra: broj detalja odnosno dešavanja u sceni u svakom trenutku je fantastično veliki, bilo da su u pitanju sitnice poput mapiranja neravnina, bloom i HDR efekti, dinamičke senke i osvetljenja, efekti eksplozija i dima ili sveprisutni depth-of-field tokom zumiranja. U igri svaki metak prolazi kroz materijale kroz koje bi prošao i u realnoj borbi (drvo, staklo, tanak metal), uz adekvatno usporenje i izmenu pravca. Igra koristi isključivo DirectX 9.0c, odnosno Shader Model 3.0, a u verzijama za Xbox360 i PlayStation 3 izgleda kao i sa maksimumom detalja na PC-ju, kako smo je i mi testirali. Pogledajmo rezultate:
Doom 3
Doom 3 testiramo sa ugrađenim Demo1 demo-om, na high podešavanjima (highest koristimo kod kartica koje imaju bar ili više od 512 MB memorije), što podrazumeva da je zvuk isključen, svi detalji na maksimumu (sve senke, poligoni i najveće teksture), ali i da je uključeno osmostruko anizotropno filtriranje. Dodat je i UltraHighQuality.pk4, koji omogućava da objekti bacaju senku sami na sebe (tzv. self-shadow). Zvuk, AI i fizika su isključeni automatski, samim pokretanjem timedemo komande.
Quake 4
Definitivno jedna od najboljih igara 2006. godine – “duhovni” naslednik fenomenalnog Quake-a 2. Iako ne može da “prikazuje” velike otvorene nivoe, Doom 3 engine itekako pokazuje koliko detalja sa lakoćom može da prikaže u jednoj sceni. Apsolutno je neverovatno sa kolikom je pažnjom tim dizajnera i programera u “Raven”-u pristupio pri izradi ove igre, koja je, uz Call of Duty 2, jedan od najlepših FPS-ova, čak i nakon 18 meseci od pojavljivanja. Za ljubitelje pravog hardcore uzbuđenja – obavezno štivo je Quake 4 i to nekoliko puta, na najtežem nivou! Kao i uvek, testirali smo sa najzahtevnijim “setup”-om, osim što smo “zadržali” kompresiju color i specular tekstura, što znači da je Ultra Quality korišten samo pri testiranju kartica koje imaju bar 512 MB memorije.
Prey
Jedna od najzanimljivijih i najinventivnijih “pucačina”, koja stiže od kreatora “čuvenog” Duke Nukema, igra Prey zadržava sve osobine klasičnog First Person Shootera, u koji uvodi elemente izmene gravitacije, letenja u Descent stilu, a tu su i delovi koji traže da uključite “vijuge” kako bi pronašli ostatak puta. Izrađena oko modifikovanog Doom III engine-a (kome je dodata “Portal” tehnologija), Prey je vizuelno izuzetno atraktivan, a igra je, iako dobro optmizovana, vrlo “stresna” za nove grafičke kartice. Kao i uvek, testirali smo sa najzahtevnijim “setup”-om, osim što smo “zadržali” kompresiju color i specular tekstura – što znači da nije “aktiviran” Ultra Quality (koji se uključuje iz konzole), već High Quality mod.
X3: Reunion
X3 Reunion je igra koja vam omogućava da iskusite život u svemiru, u dalekoj budućnosti. Možete graditi, trgovati, boriti se ili biti samo istraživač. Naravno, igra ne bi bila toliko zanimljiva da nije grafičkih dostignuća koji se mogu opisati samo superlativima. Iako nema nekih do sada neviđenih tehnologija, modelima brodova su bogato dizajnirani, raznovrsni i po tipu, i po veličini i po ulozi koju imaju, sa velikim brojem poligona (često preko pola miliona po sceni) , opskrbljeni fantastičnim color i displacement (bump) teksturama. Okolina (sam svemir, planete, asteroidi, magline…), kao da je još impresivniji, pa vas ova igra uvlači u priču i svet i samim gledanjem rolling demoa.
Company of Heroes 1.3
Prva real-time strategija u našem test-suite-u, Company of Heroes, koristi posebni next-gen engine koji Relic naziva “Essence Engine”. Ovaj engine podr žava sve nove fancy efekte kao što su High Dynamic Range i dinamičko osvetljenje, per-pixel senke, a displacement (normal) mapping je vidljiv na mnogim objektima. Takođe, igra se obilato oslanja na napredne shader rutine, ali i licenciranu Havoc fiziku, a pojedini objekti su destruktabilni, što donekle važi i za teren. Kao i obično, u igri smo uključili sve moguće efekte, što se po frame-rate-u i vidi:
World in Conflict
Druga real-time strategija u našem test-suite-u, World in Conflict, verovatno je i dalje najimpresivnija RTS igra koja je izašla na PC tržište. Bazirana je na novom Direct3D “endžinu” koji podržava čitav spisak novih efekata kakve smo do sada viđali samo u, po pravilu najinovativnijim FPS igrama. Dakle, tu su HDR, bloom i dinamičko osvetljenje, per-pixel senke, destruktabilni teren i adekvatni view-sight, paralax i normal mapping, depth of field i čitav niz drugih filmskih postprocessing efekata . Naravno, mi smo testirali sa maksimalnim nivoom detalja:
Battlefield 2142
Umesto igre Battlefield 2, koristili smo novi Battlefield 2142, smešten u periodu dva veka nakon Drugog svetskog rata. Igra je patch-ovana na 1.10 verziju (aktuelnu v1.50 ne koristimo zbog baze rezultata za kartice koje smo već testirali). Ova igra je bazirana na istoj mašini kao i Battlefield 2, ali uz nekoliko dodataka u koje spadaju detaljnije teksture, povremeni normal mapping, parallax mapping, dinamičko osvetljenje i senke, post processing efekti. Igru smo testirali na najvišim setovanjima na jednoj od zahtevnijih mapa. Pogledajmo rezultate:
Unreal Tournament 3 Demo
Unreal Engine 3 je najpopularniji “motor” koji koristi poslednje dve generacije DirectX API-ja i pored CryEngine 2, predstavlja trenutni “vrh ponude” kad je igračka industrija u pitanju. Nema potrebe da nabrajamo šta sve podržava, samo ćemo pomenuti neke prelepe naslove koje ste verovatno već videli ili igrali: Bioshock, Rainbow Six: Vegas, Medal of Honor: Airborne, BlackSite: Area 51, Gears of War, Mass Effect, Stranglehold i plejada drugih igara koje su već izašle u verzijama za Xbox 360 ili su u najavi… Demo Unreal Tournament 3 igre ne omogućava maksimalan već samo visok nivo detalja kad su u pitanju teksture, međutim, i ovo je dovoljno zahtevno da i najnovije grafičke kartice stavi na muke.
Far Cry v1.4
Igra koja je po mnogima redefinisala žanr, odnosno pooštrila kriterijume kada su vizuelni aspekt, ali i gameplay u pitanju. CryTek-ov engine je demonstracija mogućnosti Direct X 9 API-ja u praksi – tu je ogroman broj poligona i efekata koji se izvršavaju u Shader jedinicama, celih 128 MB video memorije je po nivou rezervisano i zajedno sve izgleda jednostavno fenomenalno. Fotorealistična grafika i do sada najbolja fizika i dizajn nivoa su atributi ove fenomenalne igre. Tu su i shaderi za Normal mapping, napredne enviroinment fizike, promenljiva geometrija terena, dinamičke senke i osvetljenja, motion capture animacije… Testirali smo sa Very high i Ultra high podešavanjima (gde je moguće), uz pomoć već snimljenog i opšte prihvaćenog demoa. GeForce 6 i 7 serija kartica koristi Shader Model 3.0, ali smo, kao i kod Splinter Cell Chaos Theory, ovoga puta, aktivirali HDR.
Crysis 1.1 Benchmark
Šta reći o najdetaljnijoj, grafički najimpresivnijoj igri i najzahtevnijoj igri današnjice. U odnosu na Call of Duty 4 ili bilo koju drugu igru koja vam može pasti na pamet – Crysis je bar za dva koplja iznad. Čak i na GeForce 8800 Ultra karticama i Quad Core mašinama, prosečan frame-rate iznosi dvadesetak frejmova po sekundi, u iole višim rezolucijama. Mi smo testirali kroz standardni GPU benchmark i to uz trik koji nam omogućava da “DX10-only” efekte vidimo i u DX9 okruženju. Najbolji opis ove igre zvuči otprilike ovako: koliko je FarCry tehnički ispred Duke Nukem 3D (ili bolje rečeno 2.5D) igre, toliko je Crysis ispred svog pomenutog prethodnika.
Half Life 2: Episode Two
Treća epizoda Half Life 2 priče, odnosno četvrto poglavlje priče o “Frimenu protiv korumpiranih vanzemaljaca”. Source Engine je bolji nego ikad, ali se već vidi da počinje da gubi korak sa Unreal 3, a pogotovo Crytek tehnologijom. No, poslednji build ipak ima svoje lepe osobine: broj pixel shader efekata je veći, a teksture i objekti su detaljniji. Na pravi način su dodati i efekti poput motion blur i depth of field-a, novi particle sistem omogućava bolje efekte varnica i vatre, a sistem osvetljenja i senčenja je realniji (dostigao je nivo igre Doom 3 i Quake 4). Alpha teksture (ograda, trava, drveće, šine) kojih ima u velikim količinama, sada imaju obavezno napredno filtriranje, pa izgledaju znatno bolje u odnosu na iste iz prethodnih epizoda. I fizika je znatno poboljšana, mada u ovom aspektu ni inicijalni Half Life 2 nije zaostajao. Druga epizoda donosi i multi-core podršku, a sama igra je jako dobro optimizovana.
F.E.A.R 1.08
Ova fantastična, grafički impresivna i veoma zahtevna horror igra je dobila zasluženo mesto u našem test batch-u. Testirali smo u “ugrađenom” walkpath demou, koji ispisuje prosečan broj frejmova. Naravno, sve moguće opcije vezane za grafiku, fiziku i zvuk smo stavili na maksimum – sve osim mekih senki, koje ne rade sa antialiasingom.
S.T.A.L.K.E.R
Ova pomalo bagovita igra, nakon dugog perioda razvoja, stiže na PC mašine širom sveta. Neke je razočarala, ali je činjenica da predsavlja popriličan stres za mašinu, a pogotovo grafičku karticu. Koristi napredne Shader Model 3.0 “efekte”, ali se izrazito oslanja i na klasičan multitexturing i fiksne funkcije (nije ni čudo, jer je razvoj na igri počeo kada je DirectX 7 bio aktuelan). Mi smo tesitrali sa maksimalnim nivoom detalja dostupnim iz same igre. Testiranje obavljamo fraps-om, nakon čega dajemo prosečan framerate tokom prvih 30 sekundi trčanja, a test lokacija je deo mape sa samog početka igre.
The Elder Scrolls IV: Oblivion
O ovoj igri zaista ne treba mnogo pisati, jer je u pitanju ne samo najbolja RPG igra iz prvog lica i dostojni naslednik prethodnih igara TES serijala, već i grafički revolucionaran naslov. Oslonjen na poslednju verziju Gamebryo engine-a (koji koriste i mnoge druge igre – Sid Meier's Pirates!, Civilization IV, Dark Age of Camelot itd.), Oblivion je sposoban da prikaže ogromna prostranstva prepunu bogatom florom i faunom uz nezapamćeno visok nivo detalja. Igra podržava i Havok engine za kalkulaciju fizike (nažalost, za sada samo od strane CPU-a). Zbog tehnike na koju su Bethesdi ponosni, SpeedTree, koja svaki put drugačije generiše raspored drveća i manjih stena, benchmark-ovanje u ovoj igri je pomalo nekonzistentno, te zahteva veći broj ponavljanja. Mi smo se odlučili za merenje performansi unutar veoma guste šume, u kojoj prolazimo između dva Eyelid-a (podzemne prostorije drevne civilizacije) na konju, sve posmatrajući iz prvog lica (postoji i mogućnost igranja iz trećeg lica). Svaka od tri vožnje je merena Fraps-om, zabeleženi su srednji rezultati, a onda je dat prosek. Naravno, koristili smo najviši nivo detalja koji je moguće postići iz same igre (bez self-shadows, koje nisu lepo rešeni), uključujući i HDR+AA, gde je to moguće.
Need For Speed: Carbon
A za sve ljubitelje Need For Speed serijala, evo i rezultata iz novog nastavka ove popularne franšize – Carbon. Igra je inicijalno razvijana za Xbox360 i znatno je grafički poboljšana u odnosu na Most Wanted (mnogima se doduše ne sviđa motion blur); teksture su detaljnije, broj objekata koji su animirani znatno veći, AI NPC-ova je bolji, a broj poligona je tri puta viši uz bolje efekte. Tu su i neki lepi noviteti kao što je DOF, HDR i poneka paralax occlusion mapa… Pogledajmo rezultate iz verzije 1.2.
Overclocking
Maksimum koji smo uspeli da izvučemo sa našim primerkom MSI RX4850 kartice je čak 720 / 2140 MHz, dok je model RX4870, koji već u startu radi na višem taktu (780 / 4000, u odnosu na standardnih 750 / 3600 MHz), bio raspoložen za rad na čak 790 / 4320 MHz. Jezgro je, dakle, bilo već na svojim limitima, dok memorija može prilično da se ubrza (na referentnim modelima radi na 900 MHz, a mi smo je ubrzali na 1080 MHz, što po QDR matematici daje 4320 MHz!). Pogledajmo rezultate:
Zaključak
RV770 je možda i najbolji GPU koji je ATI ikad napravio. Ovo smo mogli da konstatujemo i nakon testiranja Radeon HD4850 kartice, ali smo sačekali da budemo 101% sigurni u tu tvrdnju. Da je AMD-ova grafička divizija napravila još jači tj. brži GPU, on možda i ne bi bio isto toliko dobar, bar ne u istom smislu. Jer, kao što smo rekli kada smo krenuli da opisujemo RV770 – snaga bez balansa ne znači mnogo. A RV770 je osmišljen tako da bude dobar u svim aspektima: zamišljen je kao moćan GPU, ali ne baš po svaku cenu. Ne po cenu nestabilnosti, pregrevanja, previsoke potrošnje, lošeg yield-a, nepristupačnosti i visoke cene ka krajnjem kupcu. U najvećem broju slučajeva, Radeon HD4850 – relativno mala kartica sa običnom GDDR3 memorijom kakvu viđamo već godinama, na skromnim radnim učestanostima, uspeva da prevaziđe performanse na našem tržištu daleko skupljeg GeForce 9800 GTX modela, pa je poređenje sa GeForce 9600GT modelima, bez obzira koliko logično bilo – praktično deplasirano. Ova kartica nudi fantastičnih TeraFLOPS-a computing moći, koja se, osim u igrama, može „izmeriti“ i u brojnim GP-GPU projektima, kojih je sve više (šuška se i da će u nekom obliku biti i deo DirectX 11 API-ja). MSI RX4870 je prva Radeon HD4870 kartica koju smo testirali, i kao i ranije, u slučaju GeForce 8800 GT modela, stiže fabrički overklokovana. Tako smo bili u prilici da sa akceleratorom koji košta oko 220 evra na našem tržištu, u nekim situacijama dostignemo GeForce GTX280 karticu, čija je cena dva i po puta viša. Sa Radeon HD4870 akceleratorom, ATI je učinio najbolju stvar u pravom trenutku. Upario je brzu, ekskluzivnu GDDR5 memoriju sa čipom koji ima 256-bitnu magistralu i koji ne zahteva skup i komplikovan PCB sa kompleksnom naponskom jedinicom. RV770 nema mali broj tranzistora, ali je zaista mali u odnosu na GT200 i pravo je čudo koliko ume da se, po performansama, približi GTX280 monstrumu. Ako još jednom pažljivo proverite rezultate u pojedinim igrama, videćete i da je MSI RX4850 brži od Sapphire Radeon HD4850 kartice, koju smo testirali sa nešto starijim drajverima. To znači da mesta za napredak ima i na ovom polju, ali i da će RV770 nastaviti da zadaje muke GT200 baziranim modelima u još većoj meri, već krajem avgusta, kada se na tržištu pojavi Radeon HD4870X2.
MSI kartice na test ustupio MSI.