Branko Maksimović Uvod
ATI Technologies je nesumnjivo zadao mnogo glavobolje zaposlenim u kompaniji nVidia. Razlog za to svakako već znate – radi se o najnovijem grafičkom procesoru, prvim iz Direct X 9 generacije, koji je i po performansama u starijim, Direct X 8 ili OpenGL igrama, nadmašio dotadašnjeg kralja, GeForce 4 Ti4600, u nekim situacijama i do 250% ! Čitaoci Benchmark sajta će biti u prilici da vide koje su to situacije, a mi odmah možemo reći da će Radeon 9700 Pro biti dugo pamćena i cenjena kartica.
Na prvom mestu, njoj će se obradovati zahtevni igrači. Igranje najzahtevnijih igara u 1600×1200, pa i višim rezolucijama, pri četvorostrukom antialiasing-u i uz 8-tap anizotropno filtriranje, sa preko 60fps više nije nemoguće. Štaviše, u velikom broju slučajeva, “frejmrejt” će ići i znatno više. Ali, o tome ćemo pričati na narednim stranama. Već svi dobro znamo blisku istoriju – Radeon 8500 je trebalo da preotme veliki deo nVidia-inog tržišta, ali se zbog nedorađenih drajvera i visoke cene, kao high-end kartica nije preterano proslavio. Kada su drajveri (Catalyst v 0.22), pokazali koliko R200 može i ume, Radeon 8500 je već pripadao najvišoj srednjoj klasi, tik uz GeForce 4 Ti4200 modele, koji su, ruku na srce, ipak nešto brži u 3D okruženju. To nije sprečilo ATI da ponovo napadne konkurenta u srednjoj klasi. Najbolji u teškoj kategoriji pravi samoj kompaniji renome, ali najprodavaniji modeli u srednjoj i niskoj klasi, zapravo donose najveći deo profita. Upravo zato je i kreirana Radeon 9000 serija, odnosno čip RV250, koji smo nedavno testirali, ali smo se odlučili da prethodno prikažemo udarni model i nakon toga ono što će biti interesantnije velikom delu naših čitalaca. Dakle, dobri drajveri su tu, veliki broj proizvođača je prisutan i na našem tržištu. Samo je potrebno izabrati model.
Radeon 9700, ili R300, je prvi Direct X9 grafički procesor na tržištu. Da li je nVidia napravila pogrešan korak čekajući da TSMC dotera svoj 0.13 mikronski proces izrade, ili je samo ATI bio dovoljno hrabar da izradi 0.15 mikronsko “čudovište” od 110 miliona tranzistora, vreme će pokazati. Pogledajmo, najpre, šta sve novo u odnosu na R200, donosi novi ATI-jev čip. Podrazumevamo da ste upoznati sa tehnologijama koje su bile karakteristične za Radeon 8500, jer su mnoge od njih doživele svoje revizije i poboljšanja, i njima nećemo posvetiti pažnju kao onim suštinski novim.
U tabeli ispod možete videti nekoliko podataka o novom R300 grafičkom procesoru, koji je upoređen sa prethodnom generacijom, kao i sa najjačim predstavnikom koji konkurent trenutno ima – GeForce 4 Ti4600.
ATI Radeon 9700 PRO
ATI Radeon 9000 PRO
NVIDIA GeForce4 Ti4600
ATI Radeon 8500
Proces
Proizvodnje
0.15 Micron / 256-bit
0.15 Micron / 256-bit
0.15 Micron / 256-bit
0.15 Micron / 256-bit
Broj Tranzistora
~110 Miliona
40 Miliona
63 Miliona
60 Miliona
Memorijska Magistrala
256-bit DDR
128-bit DDR
128-bit DDR
128-bit DDR
Memorijski Propusni Opseg
19.8 GB/s
8.8 GB/s
10.4 GB/s
8.8 GB/s
AGP Standard
1x/2x/4x/8x
1x/2x/4x/8x
1x/2x/4x
1x/2x/4x
Podržane memorijske konfiguracije
128/256MB
64/128MB
128MB
64/128MB
Radni takt jezgra
325 MHz
275 MHz
300 MHz
275 MHz
Radni takt memorije
310 MHz (620 DDR)
275 MHz (550 DDR)
325 MHz (650 DDR)
275 MHz (550 DDR)
Vrsta memorije
BGA 2.x ns
TSOP/BGA 3.6 ns
BGA 2.8 ns
TSOP/BGA 3.3 ns – 3.6 ns
Broj Pipeline-a
8
4
4
4
Broj teksturnih jedinica po pipeline-u
1
1
2
2
Broj tekstura po prolazu
8
6
4
3
Vertex Shader jedinice
4
2
2
2
Pixel Fill Rate (Gpixel/s)
2.52
1.1
1.2
1.1
Texel Fill Rate (Gtexel/s)
2.52
2.2
2.4
2.2
Antialiased Texture Fill Rate
(GTexel/s)
12.2
1.1
4.8
1.1
Memorijski propusni opseg
(GB/s)
20.8
6.4
10.4
8.8
Podržana verzija Vertex Shader-a
2.0
1.1
1.1
1.1
Podržana verzija Pixel Shader-a
2.0
1.4
1.3
1.4
Direct X
9.0/9.1
8.1
8.0
8.1
Hardverski tip FSAA
MultiSampling
SuperSampling
MultiSampling
SuperSampling
Tehnike optimizacije Mem.
Prop. Opsega
Hyper Z III
Hyper Z II
LMA II
Hyper Z II
Integrisani RAMDAC/ Interna
Paleta
2 x 400 MHz / 40-bitna (10-bita
po boji)
2 x 400 MHz / 32-bitna (8-bita po
boji)
2 x 400 MHz / 32-bitna (8-bita po
boji)
2 x 400 MHz / 32-bitna (8-bita po
boji)
U takozvanoj “performance” klasi, cilj opravdava sredstva koja se ulažu i on nam je sasvim jasan. Pomalo je nezahvalno porediti grafički čip nove generacije sa GPU-om iz prethodne generacije, međutim, i bez poređenja, možemo samo biti oduševljeni poslom koji su obavili ATI-jevi stručnjaci. ATI i UMC su napravili najkompleksniji grafički procesor, ako se posmatra sirovi broj osnovnih poluprovodničkih elemenata (preko 110 miliona tranzistora). S obzirom da je R300 veoma složen procesor, problemi zagrevanja i napajanja su rešeni na sličan način kao kod sistemskih procesora. FCBGA format postavlja preko 1000 pinova iz samog GPU-a na dole, a tzv. “organic” pločica, slična onoj na Athlon XP procesorima, obezbedila je nešto bolje hlađenje. Ostaje nejasno zbog čega nije napravljen heat-spreader, kakav možemo videti na Pentium 4 procesorima. Osim nekoliko low-level kondenzatora, koji su mogli biti izolovani, ne postoje nikakvi kontakti na samoj površini procesora (poput onih na Athlon procesorima. 0.15 mikronski proces izrade je veoma zreo, ali je i R300 veoma komplikovan GPU i može se reći da je ATI sa izvesnom količinom rizika stupio u proizvodnju sa tim tehnološkim procesom. Zato ne sumnjamo da će se pojaviti i druga verzija R300 jezgra, u 130 nanometarskoj tehnologiji, koja će dostizati radne frekvencije od oko 400MHz. Da li je nVidia bila manje hrabra ili nepromišljena kada je odlučila da nV30 bude izrađen u 130 nanometara, makar to usledilo i ovoliki zaostatak, ili je taj GPU, jednostavno isuviše kompleksan da se i pomišlja na 0.15m proces ?
Direct X 9 – konacno!
Deveta generacija Microsoft-ovog DirectX API će verovatno postati standard i za ozbiljnije aplikacije nego što su to igre. Tu pre svega mislimo i na komercijalne CAD programe, a možda i 3D dizajn i modeling pakete. Preciznost podataka sa kojima procesor radi je mnogostruko uvećana, a to je donelo čitav niz mogućnosti i povećalo samu kompleksnost. Kao što se na gruboj shemi može videti, najveći deo procesora R300 čini nova Pixel Shader “jedinica”, koja sada radi sa brojevima sa pokretnim zarezom.
Deveta generacija Microsoft-ovog DirectX API će verovatno postati standard i za ozbiljnije aplikacije nego što su to igre. Tu pre svega mislimo i na komercijalne CAD programe, a možda i 3D dizajn i modeling pakete. Preciznost podataka sa kojima procesor radi je mnogostruko uvećana, a to je donelo čitav niz mogućnosti i povećalo samu kompleksnost. Kao što se na gruboj shemi može videti, najveći deo procesora R300 čini nova Pixel Shader “jedinica”, koja sada radi sa brojevima sa pokretnim zarezom.
Međutim, veliki pixel fillrate ne bi mnogo vredeo da nije podržan veoma velikim memorijskim propusnim opsegom.
Isto tako, ni brza memorija ne bi bila toliko efikasna bez pametno rešenog memorijskog kontrolera. ATI je u ovom slučaju pozajmio ideju od nVidia-e, i uvrstio nešto što liči na Crossbar kontroler iz LightMemory Arhitecture II sistema, čiji smo princip rada više puta objasnili. ATI tvrdi da je njihov memorijski kontroler efikasniji zbog, jednostavnije rečeno, preplitanja podataka koji prolaze kroz magistralu. Dakle, u svakom od četiri kanala se u isto vreme mogu naći i Z informacije, teksture, vertex cache podaci itd. Uz to, širina memorijske magistrale je 256-bita, pa se radi o četiri 64-bitna kanala, a 20.8 GB/s je, moramo priznati, impresivna cifra. Još jedan podatak iz specifikacije navodi i podršku ovog memorijskog kontrolera za DDR II memoriju, što je garant da R300 tehnološki neće brzo zastareti i da će predstavljati dobru osnovu za dalja unapređenja.
AGP 8x
Prva grafička kartica na tržištu, koja je koristila AGP3.0 (AGP 8x) standard, koristi SiS-ov Xabre GPU. Do sada smo videli samo nekoliko situacija u kojima su AGP transfer, fast writes i ostali trikovi odigrali značajniju ulogu. Čak i u današnjim igrama, situacija da karticama zatreba dodatna količina memorije, retko se javlja. Ipak, dobro je imati bržu komunikaciju između northbridge-a i grafičke kartice (u ovom slučaju 2.1 GB/s) i u regularnom radu, jer svi podaci do GPU-a stižu baš ovim putem. AGP teksturisanje neće zaživeti u komercijalnim programima, pre svega zbog trenda povećanja lokalne video memorije. Radeon 9700 je AGP 8x kartica, ali će raditi i na starijim matičnim pločama, sa AGP2x i AGP4x portovima.
Vertex Shader 2.0
Radeon 9700 je prva kartica u klasi ispod 400 dolara, koja u svom procesoru integriše čak četiri paralelne Vertex Shader jedinice. One rade u sprezi sa novom, poboljšanom triangle setup jedinicom. Kao što znamo, Vertex Shader je, kada je GeForce 3 predstavljen, zamenio čuveno “T&L”, ali se transformacija i informacije o osvetljenosti i dalje odvijaju unutar ove jedinice. Njegova sada potpuno programabilna priroda, a to znači rad sa FP brojevima, stvorila je uslove za izvršavanje internih Direct X funkcija, loop-ova i procedura. Određeni delovi programa se mogu po potrebi ponavljati, što znači da će i sam kod biti kraći, a njegova kontrola bolja. Ovi programi mogu, primera radi, da izvrše hardverski morfing objekta, podignu kvalitet animacije objekta (skeletal/matrix pallete skinning i.e. animacija u nVidia Wolfman Demou, ali još realističnija) na daleko viši nivo, ili obezbede neki drugi “efekat” vezan za samu geometriju i osvetljavanje objekta. Vertex programi sada mogu da imaju i do 1024 različite instrukcije (prethodna verzija je podržavala do 128), a deo shadera koji je zadužen za osvetljavanje vertices-a, sada radi sa FP brojevima i 128-bitnom paletom boja, što će omogućiti do sada neviđeno realne scene.
Jedno od veoma bitnih novina, kada je porast performansi u pitanju, jeste već pomenuta, unapređena triangle setup jedinica. Veliki broj trikova, kao i nekoliko potpuno novih rešenja, učinili su da ova jedinica bude sposobna da procesira svaki vertex koji je stigao iz vertex pipeline-a bez stvaranja uskog grla. GeForce 4 Ti4600 takođe ima veoma dobru triangle setup jedinicu, ali je njegov dual-vertex shader sistem mnogo manje zahtevan kada je količina pristiglih vertices-a u pitanju. Problem sa ograničenim triangle troughput-om, ima Matrox Parhelia 512, koja takođe ima četiri vertex shadera, ali i dalje konvencionalni triangle setup. Još jedna tehnologija koja je usko vezana za vertex shader, jeste n-Patches sistem, ali ćemo to ostaviti za deo priče pod nazivom Truform 2.0
Pixel Shader 2.0
Prvi nVidia procesor sa četiri pipeline-a, bio je GeForce 256 i ta praksa je nastavljena i u četvrtoj generaciji ovih kartica. ATI je prvi Radeon konstruisao nešto drugačije – dva pipeline-a sa tri teksturne jedinice, što se kasnije pokazalo kao manje uspešna kombinacija. Radeon 8500 je, potom, stigao sa četiri pipeline-a, dok se broj teksturnih jedinica smanjio, te je tako napravljena kombinacija koja dosta liči na onu kod konkurenta. R300 je, svakako nova generacija i veliki korak unapred, pre svega iz razloga što njegovo jezgro ima čak osam pixel shader rendering pipeline-a.
Budući da svaka od osam pixel shader jedinica, ili pipeline-a, podržava PS verzije 2.0, odnosno Direct X9, onda može da razume programe koji sadrže do 160 instrukcija, 32 operacije sempling-a tekstura sa 16 različitih teksturnih mapa uz 64 operacije color blending-a po jednom prolazu. DirectX 9 zahteva rad sa brojevima sa pokretnim zarezom, tako da su pixel shaderi zapravo 128-bitne FPU jedinice.
FP brojevi – Direct X9 specijalitet Kvalitet 3D grafike i fotorealističnost scene, ne mogu se postići na karticama sadašnje generacije, pre svega iz razloga što iste, najgrublje moguće rečeno, rade sa velikim procentom greške. T&L engine, Shading Rasterizer, pa čak i delom programabilni Shaderi kakve podržavaju GeForce 3 i 4 Titanium, kao i Radeon 8500 kartice, operišu sa integer brojevima, za koje i oni koji su malo učili programiranje u srednjoj školi, znaju da su celobrojne vrednosti. Pixel Shader jedinica u Radeon 9700 jezgru, radiće sa Floating Point vrednostima koji omogućavaju “prikaz” čak 128-bitne kolor palete. Zbog čega je “FP color” sistem toliko bitan? 32-bitna RGBA paleta od podrazumeva korišćenje po osam bita za svaku od osnovnih boja. Ako tako posmatramo, problematika je jasna. 256 nijansi za svaku od ovih vrednosi može izgledati dovoljno, ali je kontrola nivoa svake osnovne boje veoma ograničena. Isto tako, rad sa integer vrednostima, gde se trunc (ili u boljem slučaju round) operacija konstantno izvršava da bi se kalkulacije izvršavale sa celobrojnim vrednostima, manje je precizan u situacijama kada u jednoj sceni morate imati veoma svetle oblasti zajedno sa veoma tamnim. 128-bitne vrednosti sa pokretnim zarezom, ne samo što omogućavaju po 32-bita za svaku od RGBA vrednosti, već je omogućeno kreiranje potpuno novih grafičkih efekata.
Podrška za Pixel Shadere verzije 2.0 je, pored mnogih drugih, revolucionarnih unapređenja, donela i maksimalni unos od 16 tekstura u prolazu, što objašnjava postojanje osam rendering pipeline-a. Radeon 8500 i GeForce 4 više od šest tekstura po površini obrađivati iz više prolaza, dok R300 ima mogućnost da isto uradi u jednom, čuvajući ostatak za ekstra sitnice tipa anisotropic ili multisampling. Bar dok se ne pojave znatno zahtevnije i modernije igre.
Pixel Shader-i verzije 2.0 primaju, kao što smo i pomenuli, do 160 instrukcija u prolazu. Potpuna programabilnost omogućava čak i programiranje posebnog koda za aplikacije kao što su 3D Studio MAX ili Lightwave, kako bi se kalkulacije konačnog renderovanja scene prebacile na teret GPU-a. Dakle, ako ATI nastavi ozbiljno kao što je počeo, možemo videti patch za ovakve softverske pakete. Do sada je viđena prezentacija programa RenderMonkey kada je jedna veoma komplikovana animacija renderovana brzinom od jednog frejma za desetak sekundi. Poređenja radi, za jedan frejm, sistemskom procesoru je u softverskom modu bilo potrebno i po desetak minuta!
High Dynamic Range
Sada se možemo vratiti na priču o preciznoj 128-bitnoj FP kolor paleti. Pomenuli smo situacije kada je programerima i dizajnerima potrebno da kontrolišu osvetljenja u sceni. Ako uzmemo Quake III kao primer, i podesimo osvetljenost pomoću r_gamma ili neke druge komande, cela scena će biti svetla, čak i one oblasti koje bi trebalo da su crne. Pogledajmo jedan primer:
Originalna slika je levo. Kada se osvetli previše, i u drugoj prostoriji, levo od centralne, mogu da se vide teksture (freske) na tavanici, dok su ostali delovi previše svetli. Pretpostavimo da je u samoj prostoriji dosta mračnije, i želimo da smanjimo osvetljenje. Tada će se smanjiti i ambijentalno osvetljenje koje dolazi od spolja, ali recimo da programer želi da je napolju i dalje dan. Naravno, sa High Dynamic Range, postoji više nivoa osvetljenosti, kao i bolja kontrola RGBA nivoa, odnosno njihovih “pozicija” (range) u sceni. Primer je i slika, u kojoj je manja osvetljenost unutar prostorije, ali zbog toga nije došlo do nestanka osvetljenja od spolja, koje se vidi na zidu.
Hyper Z III
Još u vreme kada su 3D grafičke kartice bile ograničene memorijskim propusnim opsegom, kada je i jedan Quake III mogao da “zagorča život” igračima velikim brojem površina odnosno poligona, ATI je na tržište izašao sa prvom tehnikom koja će na pametan način sprečiti T&L procesor da obrađuje zaklonjene površine. Ideja je vrlo jasna, a realizacija efikasna i ATI joj je dao ime Hyper Z. To je, kao što znamo, zapravo skup tehnika (Hierarchical Z, Z-Compression i Fast Z-Clear) koje čuvaju resurse GPU-a i memorije.
Hierarchical Z, kome sada možemo dodati i broj III, sada je mnogo efikasniji od prethodnih. Ovaj sistem pristupa Z-buffer-u i otkriva koja će površina biti iza one koja se trenutno procesira, ako se posmatra sa 2D ravni koja predstavlja naš ekran (virtuelnog posmatrača). Naravno, ako se neka površina imalo vidi (npr. 2% zida iz neke sobe, kroz vrata), cela površina mora da se renderuje. Međutim, Hierarchical Z III ima i novi Early Z sistem, koji čita Z položaj na nivou piksela, a ne površine, tako da se tačnije može odrediti koji su pikseli zaklonjeni (occluded), a koji se vide. Ne treba naravno govoriti koliko ovo utiče na efikasnost celog sistema.
Z-Compression je tehnika koja u letu kompresuje Z-Buffer informacije, te se prilikom pristupa u isti, štedi dragoceni memorijski bandwidth. Nije bilo reči o povećavanju efikasnosti u odnosu na prethodni, ali ako je frekvencija čipa povećana na 325MHz, onda je viši učinak zagarantovan. J
Fast Z-Clear je još jedna od bitnih tehnika o kojoj smo i ranije pričali. Podsećanja radi, pomenućemo da je reč o algoritmu koji pre svakog novog frejma brzo prazni Z-Buffer, tako što od sitnijih informacija pravi blokove većih, a onda ih efikasnije, tj. brže briše, uništavajući samo prvi, mali deo na početku svakog od njih. Truform 2.0
Truform je tehnika koja je prvi put viđena na ATI Radeon 8500 modelima, dok je kasnije, kroz drajvere bila omogućena i za starije modele. Za čitaoce koji nisu upućeni u materiju, reći ćemo da se radi o dodavanju poligona na manje soložene objekte kreiranjem novog vertices-a na mestu na kome se nalazi početak vektora koji je zbir vektora iz susedna dva temena. Cela stvar je vrlo jednostavna, pogledajte priloženu sliku i setite se sabiranja vektora iz prve godine srednje škole.
Međutim, Truform koji objedinjuje Radeon 9700 je mnogo više od toga. Matematički generisani vertices-i ne izgledaju lepo kada se menja Level-Of-Detail (LOD), sa udaljenjem objekta u nekoj igri, jer tada ima manje detalja (poligona) od kojih treba početi sa transformacijom, te on i posle primenjenog truforma na trenutak menja oblik. Truform 2.0 primenjuje Continuous Tesselation, što znači da se poligoni dodaju po potrebi, što je omogućeno primenom tzv. delimičnog deljenja (fractional tesselation). Naravno, ovo je postalo moguće tek od kako je Vertex Shader počeo da radi sa Floating Point brojevima.
Truform 2.0 omogućava i primenu displacement mapa na objekte, tako da će ovoga puta, verujemo, čitava stvar zaživeti i u igrama (a ne samo demoima). U pitanju je tehnika koja nadograđuje relativno jednostavan objekat sa novom “geometrijom” na osnovu displacement mape. I ovo je relativno jednostavan trik- displacement mapa daje podatke o visini piksela odnosno teksela u odnosu na površinu objekta, i to na osnovu osvetljenosti. Nešto slično može se videti u programu kao što je Bryce 3D, tj. njegovom editoru za teren. Vi zapravo crtate 2D sliku belom bojom po crnoj pozadini, a belina same tačke (procenat bele “boje”), određuje visinu tačke na tom delu. Vertex Shader procesira te podatke i postavlja piksel sa teksture na određenu visinu u odnosu na stvarnu površinu objekta, ili na osnovu tih podataka kreira dodatnu geometriju. To zavisi od načina na koji je Displacement Mapping realizovan ili konkretnog slučaja.
SmoothVision 2.0 – Pravi MultiSampling
Prethodne metode antialiasing-a na ATI Radeon karticama se nisu preterano proslavile. Kada je Radeon 8500, kao dovoljno snažan GPU, bio sposoban da iznese dovoljan framerate u situacijama kada je korišten supersampling, došlo je do narušavanja kvaliteta tekstura. Ovo se dešava iz razloga što je ATI-jev supersampling bio jednostavan rendering iste scene više puta, samo što je svaki naredni frejm, bio pomeren (shifted) da bi se pikseli na ivicama “popunili”. Upravo zbog toga je došlo do gubitka u kvalitetu tekstura. NVidia-in sistem je bio nešto pametniji ali i zahtevniji – renderovanje u višoj rezoluciji, a zatim resize-ovanje u mod u kome se izvršava aplikacija.
Novi Multisampling metod, svodi se na pregled Z vrednosi svakog piksela, i na osnovu njegove dubine, kalkuliše se njegova “zaklonjenost”, te se tako dolazi do onih koji se nalaze na ivicama objekta. Tada se najbliži susedni pikseli boje srednjom vrednošću boje pozadinskih piksela i piksela na ivicama objekta. Prilično pametno, zar ne? Prednost u odnosu na Multisampling kod nV25 procesora, jeste u tome što se i teksture sa transparentnim “bojama” procesiraju tokom antialiasing-a (npr. teksture trave u UT2003 igri), što dosta popravlja celokupni utisak o kvalitetu scene.
Anisotropic
NVidia kartice su do skoro bile neprikosnovene kada je kvalitet tekstura, odnosno kvalitet filtriranja u pitanju. GeForce 4Ti modeli rade sa anizotropnim filtriranjem uz trilinearno semplovanje, dok su Radeon 8500 kartice uzimale bilinearne semplove za definisanje boja piksela na objektu. Moramo odmah reći da najnoviji, adaptive anisotropic, na R300 procesoru izgleda gotovo savršeno. Igre kao što su Mafia ili Unreal Tournament 2003 zaista prikazuju neviđeno detaljne teksture, čak i na ogromnim udaljenostima, što se za GeForce 4 Ti kartice ne može u potpunosti tvrditi. Ranije smo objašnjavali kako funkcioniše anizotropno filtriranje na nV25 karticama, i pominjali od kolike je važnosti za kvalitet rendering-a. Jednom kada se naviknete na oštre teksture, jednostavno nema povratka na trilinear ili bilinearni mod.
VideoShader
Verujemo da ATI kartice već smatrate kao bolje za prikaz multimedijalnih sadržaja, iako mnogi tvrde da ni nVidia modeli nisu lošiji. Ovoga puta, ATI ide i korak dalje – 3D engine se koristi za prikaz video materijala!
Ako znate kako izgleda video sa malim bit-rate-om, i kockasti artefakti vam smetaju – Radeon 9700 je prava stvar za vas. U praksi nismo probali, ali podrška za MPEG2 i MPEG4 kodirani video materijal tek treba da stigne. Naime, radi se o eliminisanju kockaste strukture videa tako što se svaki frejm šalje u pixel shader engine, i tamo procesira, kao što bi se procesirala i tekstura. Na primeru se može videti kako sve to izgleda:
Saphire Radeon 9700
Za razliku od prethodnih testova, prva Radeon kartica nove generacije nam nije stigla sa potpisom matične kompanije. Međutim, može se reći i da jeste, jer je firma Saphire ATI-jev strateški partner samo iz razloga što iz njegovih proizvodnih pogona stižu “prave”, odnosno built by ATI kartice. Ova proizvođač ima dve različite serije kartica – built by design (koje kasnije pakuje ATI Tech. u one svoje lepe kutijice), i powered by design, kakvu smo imali na testu. Bez obzira na to, i built by ATI Radeon 9700 izgleda potpuno isto i koristi apsolutno iste komponente kao i ovaj sa testa. Što je još lepše, na njemu će raditi i drajveri za built by ATI model!
Saphire Radeon 9700 Pro smo na test dobili bez kutije (bulk), ali su svi prateći kablovi i instalacioni CD stigli sa njom. U trenutku testiranja, za Radeon 9700 modele nisu postojali noviji Catalyst drajveri, te smo koristili verziju sa CD-a (0.22). Pored njega, u pakovanju su se našli Radeon adapter DVI-I u VGA, S-Video i kompozitni kablovi i odgovarajući adapter za Video-out.
ATI je promenio boju svojih kartica u krvavo crvenu, koja je već dugo njihova prepoznatljiva nijansa kada su nazivi i logoi u pitanju. Ipak, ono što smo na njihovim karticama oduvek voleli, jeste jednostavna, prava hardverski-zelena boja, onakva kakvu smo nekad viđali na svim komponentama. Ipak, lak na štampi je ovoga puta crvene boje, što je nekako dovelo do gubitka prepoznatljivosti. Kao da je i pravi ATI hteo da liči na “powered by” modele svojih saradnika. Izgledom, Radeon 9700 više podseća na neki dobar GeForce 4 MX460 ili Ti4200 model sa BGA memorijom, nego na ATI karticu.
Kvalitetu se svakako ne može prigovoriti. Šestoslojna štampa je visokog kvaliteta, visokokapacitetni kondenzatori takođe. Kuler u centralnom delu je karakterističan po tamnom mat laku i ventilatoru velikog promera. Osim takt generatora, i jednog čipa koji generiše DVI signal, dodatnih mikroprocesora gotovo da i nema. Funkcije poznatog RageTheater čipa, prebačene su u samo jezgro. Osam BGA modula od po 16MB, potpisao je veliki Samsung a njihovo vreme je, po oznakama 2.x ns. Iz iskustva koje smo imali sa ovim modulima, mogli bi slobodno reći da se radi o 2.8ns čipovima.
Između DVI i VGA konektora, nalazi se i klasičan S-Video priključak, a zbog visoke potrošnje R300 grafičkog procesora, obezbeđeno je dodatno napajanje na gornjem desnom uglu kartice kome odgovara tip konektora za floppy. Naravno, u slučaju da dodatni nemate, postoji i određeni adapter na standardni IDE 12v priključak.
Kvalitet slike, multimedija
Prikaz koji je Radeon 9700 kartica dala je očekivano visok, može se reći najbolji koji smo videli. Rezolucija 1600 x 1200 je odlično oštra, a 2048 x 1564 bi bila takođe upotrebljiva na nekom 22” monitoru. O multimediji ne treba previše pričati. TV out u 1024 x 768 je veoma lepo definisan, te smo izvukli maksimum iz postojećeg TV aparata. Zaista, i ovoga puta, izreći ćemo samo reči hvale.
Test Konfiguracija Kartice smo testirali na test sistemu prikazanom u tabeli:
Procesor
AMD Athlon XP 2100+
MHz (166*10.5)
Matična ploča
Abit KX7-333 (CPU Decode:
Ultra, AGP 4x, Fastwrites, Ultra performance setting) VIA 4in1 drivers
v4.39 – powered by Chieftec Dragon 300W
Memorija
512MB PC2700 Samsung
@ 166 MHz (CAS 2, 2-5-2, 1T, 4 Way, Turbo…)
Hard Disk
IBM DeskStar DTLA 60GXP
“Death Star”
Video Karte
ASUS V8460 Deluxe GeForce 4 Ti4600 – 128MB DDR Detonatori 29.42Saphire
Radeon 9700 Pro – 128MB DDR – Catalyst 0.22
Monitor
Samsung SyncMaster
900NF
Cooling
Titan TTC-D5TB(3)
DVD uređaj
Pioneer 116 DVD-ROM
CDRW uređaj
Teac CD-W540E 1.0F
Operativni sistem
Windows XP Service
Pack 1
Igre/Bench programi
Quake 3 Arena v1.17;
Demo 001 Lucas Arts Star Wars Jedi Knight Episode II Codecreatures Benchmark MadOnion.com 3DMark 2001 Second Edition (build 330) Nova Logic Comanche 4 Benchmark Demo PowerVR’s VillageMark nVidia Chameleon MarkSpecORG ViewSPEC Perf 7.0
Radeon 9700 i igre
Šta možemo očekivati od jedne tako sjajne grafičke kartice kao što je Radeon 9700? Kada se visoke performanse podrazumevaju, očejuje se viši kvalitet prikaza. Na tom polju, R300 ne samo da nije razočarao, nego je u velikom broju igara i oduševio. Igre na engine-u Quake 3 izgledaju istovetno kao i na GeForce 4 karticama, ali se razlika vidi u LithTech igri No One Lives Forever 2 (Direct 3D), Mafia i Battlefield 1942. Isto tako, napredak je vidljiv i u predstojećem mega hitu – Uneal Tournament 2003, a ogleda se, kao i u prethodnim, u visokom framerate-u uz anisotropic filter maksimalnog nivoa. Pored toga, opcija Color Fill čini da boje u igrama budu lepše, sa finijim prelazima između nijansi, ali ne i previše jake. Ako se setimo, Radeon 8500 nas, u odnosu na GeForce 3 Titanium kartice, u igrama nije toliko oduševio, pa još jednom moramo pohvaliti tim koji stoji iza odličnog, a vreme će pokazati i veoma uspešnog Radeon-a 9700.
Drajveri
S obzirom da je R300 potpuno drugačiji čip od svojih prethodnika, UDA drajveri su ostali samo za RV250 i starije grafičke čipove. Radeon 9700 dolazi sa potpuno novim i posebnim drajverima, koji , ovoga puta izvlače dovoljno iz novog Radeon-a. Potrebno je, tu i tamo, malo više kompatibilnosti sa pojedinim igrama, međutim, generalno se za upravljačke programe može reći da su ušli u zreliju fazu. Ili to možemo reći za programere. J
OpenGL – Quake III Arena
Kao što znamo, Q3 Arena je stari dobri OpenGL benchmark kod koga važi pravilo više megahertza – viši framerate. Ipak, R300 je pametno projektovan GPU, pa se svih osam pipeline-a daju zaposliti da bi mu dali značajnu prednost nad konkurencijom Quake III će biti prisutan sve do pojave igre Doom III, upravo zbog nedostatka kvalitetnih OpenGL benchmark programa. Verzija sa kojom testiramo je standardna 1.17 sa x86 optimizovanim dll-ovima.
Max Quality Setting: Teksture na najvišem nivou Geometrija na najvišem nivou Primenjeni: r_subdivisions 1 , r_lodError 0 i com_maxfps 0 High Quality Sky Ejecting Bras uključen
Sync Every frame isključen Lightmap lights Force Player Models isključen Dynamic Lights uključen Marks On Walls uključen Sound Quality low
Optimizacija drajvera je velika stvar. Kada je “opuštena situacija” u pitanju (800 x 600), čak i sporiji GeForce 4 Ti4600 može da prestigne novi Radeon. Već u sledećoj višoj rezoluciji, stvari se menjaju.
Slična situacija je i u 32-bitnoj paleti, ali su se performanse Radeon 9700 kartice gotovo neznatno umanjile u odnosu na 16-bita.
OpenGL – StarWars Jedi Knight II
Jedi Knight II pokreće modifikovana verzija Quake III Team Arena engine-a. Na test mapi se može primetiti solidan broj svetlosnih efekata, stencil buffer senki, relativno velike teksture i veliki broj poligona. Naša podešavanja su jednostavna za razumevanje – kartice smo testirali sa apsolutnim maksimumom zahtevnosti. Teksture i geometrija su na najzahtevnijem nivou, kao i prikazivanje svetlosnih efekata i senki dok je Anisotropic filtering bio isključen u regularnom toku testiranja. Kvalitet zvuka je spušten na low. Testiranje kroz Jedi Knight II je veoma jednostavno. Pokrene se multiplayer deo igre, a zatim podese grafičke opcije. U konzoli (~) je potrebno otkucati:
Devmap ffa_bespin (enter) timedemo 1 (enter) demo jk2ffa (enter)
Da, situacija koja je začudila mnoge strane kolege. Jedi Knight je veoma čudna igra – Xabre je, ako se sećate, u njoj brži nego u Quake-u 3? I ovde je, GeForce 4 Ti pretekao Radeon 9700 Pro, i to sve do poslednje, najviše rezolucije. Ako pogledamo još jednom 16-bitnu paletu, primetičemo da se kod kartice sa R300 GPU-om framerate gotovo ne smanjuje kako raste rezolucija. Fantastično, zar ne?
OpenGL – SpecViewPERF 7.0
SpecOPS-ov OpenGL test koji pred video kartu postavlja nešto drugačije zadatke nego što to čine poznate igre. Ovaj skup OpenGL programa testira specijalne funkcije neke 3D kartice, koje se koriste u profesionalnim i poluprofesionalnim 3D aplikacijama tipa CAD i 3D Modeling. Mi smo koristili smo poslednju aktuelnu verziju (7.0) koji se sastoji od šest celina. Kao što već znate, u pitanju je karakterističan i relevantan test. Za više informacija o svakom delu ovog programaskog test paketa, možete pogledati sajt proizvođača, ili neke od naših prethodnih testova.
Još jednom ćemo pomenuti optimizaciju drajvera. Verujemo da bi već sa verzijom koja je izašla pre dan ili dva, Radeon 9700 bio brži od najjačeg GeForce 4 Titanium modela, u svim kategorijama.
Direct X 8 – CodeCreatures Benchmark
Verovatno najlepši i najzahtevniji test, upravo je CodeCreatures Benchmark. Baziran je na jednom od verovatno najkompleksnijih engine-a na koji smo videli. Program koristi Shadere verzije 1.3 (Direct X 8.0), i odlično ukazuje na to kako se kartica snalazi sa teksturama veoma visoke rezolucije i velikom količinom poligona. Vizuelna atraktivnost i fotorealisticnost su na visokom nivou, ali pod uslovom da kartica izvuče potrebnih 24 fps, što se dešava samo na brzim sistemima sa GeForce 4 Ti4600 i jačom karticom. Kako smo na testu imali Radeon 9700, predpostavićete da smo zaista uživali u prizoru. Default test se izvršava u tri rezolucije: 1024×768, 1280×1024 i 1600×1200. Moguće je kreirati batch u kome je ćete izabrati sopstvene modove od rezolucija 640*480 do najvišeg grafičkog moda koji kartica podržava.
Pošto je ovo prvenstveno test pixel shadera – zna se ko je glavni. Radeon 9700,
naravno.
Direct X 8 – Comanche 4 Nova Logic-ov Comanche 4, je još jedan u nizu D3D testova, ali dovoljno karakterističan da zasluži mesto koje trenutno uživa na test sajtovima. Novi Comanche koristi Direct3D 8.1. ali radi i sa starijim karticama. Pri testiranju, smo koristili apsolutni maksimum za geometriju, teksture, količinu efekata i granicu vidljivosti. Zvuk je bio isključen u samom programu, a rezultati zaokruživani na dva decimalna broja.
GeForce 4 Ti se drži sve do najvišeg grafičkog moda, verovatno radi optimizacije same igre za nVidia bazirane kartice. Zapravo, u to smo gotovo ubeđeni.
Direct X 8 – 3DMark 2001 Pro SE (build 330)
Kroz 3D Mark smo kao i uvek testirali na uobičajeni način (default podešavanja). Ono što se odmah može primetiti, jeste neopisiva lakoća izvršavanja svih testova na Radeon 9700 kartici. Advanced pixel shader test radi i do 3 puta brže nego na GF4 Ti4600 modelima, dok Nature scena dostiže i framerate od 100 u rezoluciji 1024 x 768, što do sada svakako nismo videli. Multitexturing test, sa druge strane, radi bolje na GeForce 4 Ti4600 modelu! Ipak R300 je pokazao sjajne performanse te možemo preporučiti MadOnion-u: napravite novi, zahtevniji benchmark program za Radeon 9700! Pogledajmo rezultate.
Ako je Advanced Pixel Shader tri puta brži, a većina ostalih testova pokazuje solidnu prednost Radeon 9700 modela, onda smo mogli da kažemo da smo ovakav ishod i očekivali. Verujemo, razlika u korist ATI-jeve kartice bi bila i veća na nekom Pentium 4 sistemu na 3GHz i RDRAM memorijom.
Prednost Radeon 9700 kartice je konstantna, kao što se može i primetiti.
Direct X 7 – VillageMark
VillageMark nam je poznat kao Occlusion Detection benchmark. U njemu će imati prednost kartice koje dobro rade sa multiteksturama (Kyro, Radeon) i one koje imaju dobar visibility podsistem (Kyro, GeForce 4 Ti, Radeon 9700). Naravno, uz sve to, ovo je klasičan Direct X 7 test.
Novi Hyper Z sistem je zaista efikasan! Pogledajte samo prednost Radeon-a 9700
Pro u najnižoj rezoluciji.
Ipak, GeForce 4 Titanium se zaista ozbiljno drži – teško da se njegovi rezultati
mogu okarakterisati kao loši.
Direct X 8 – Chameleon Mark
NVidia-in Chameleon Mark prikazuje animiranog kameleona koji menja boje, postaje providan i refleksivan. U vreme kada se pojavio, imao je veliki broj poligona, dok mu to danas nije glavna karakteristika. Ovaj program koristi i Pixel i Vertex Shadere verzije 1.1. a tu su i efekti blending-a, simuliracije refrakcije i refleksije, zatim enviroinment i dot3 bump mapping. Grafički engine koristi i kompresiju tekstura, koja smanjuje njihovu ukupnu veličinu na oko 64MB. Test se izvršava u tri moda, preko batch fajlova: shiny, real i glass. Podsećanja radi, reći ćemo da prvi od njih pokazuje enviroinment i cube mapping, “real” dodaje i klasične dot 3 product mapiranje uz texture blending i procedural adaptive morphing, dok “glass” aktivira efekte refrakcije, a alpha tekstura i druga bump tekstura i dalje na njemu.
Veoma čudno, zar ne? Intenzivna upotreba pixel shadera u ovom testu, postavlja Radeon 9700 na ubedljivo prvo mesto. Verujemo da u nVidia-i znaju da ih je novi ATI potpuno potukao u sopstvenom testu, te da marljivo završavaju nV30 i pripremaju nove drajvere. Složićete se sa nama – biće ovo zanimljiv Božić.
Overclocking
0.15 mikronski proces izrade u kombinaciji sa velikim brojem tranzistora i visokim početnim taktom, učinio je da pomislimo da Radeon 9700 neće biti tako sjajan za overklokovanje. Međutim, nikako se nismo razočarali. R300 GPU na prvim test primercima koji su dobili strani hardverski sajtovi je radio na 325MHz, ali su mnogi predpostavili da će retail verzija biti podešena na 300MHz. Ipak, i powered by ATI modeli su postavljeni na čitavih 325MHz na koliko radi jezgro i 620MHz za memoriju, što je, po nama niže nego što mislimo da bi trebalo. Svakako, 256-bitna memorijska magistrala dosta pomaže, ali zbog čega ići niže od GeForce 4 Ti4600 modela? Možda će upravo zbog toga, zaljubljenici u overkloking biti oduševljeni kada čuju koliko je postigla prva revizija jezgra na jednoj built by ATI kartici. Bez mnogo odugovlačenja, rećićemo samo 365 / 720 MHz !!! To znači da je jezgro radilo stabilno na čak 40MHz iznad fabričke specifikacije, sa običnim vazdušnim hlađenjem i na ambijentalnoj temperaturi od preko 30 stepeni celzijusa! Memoriju smo podigli za okruglo 100 efektivnih megahertza. Treba napomenuti da je Radeon 9700 radio i na 375 / 730 MHz, ali uz konačno zakucavanje. Nema sumnje da bi uz obezbeđeno hlađenje memorije, i 750MHz bilo moguće ostvariti, jer se memorija ipak dosta zagrevala, zajedno sa čitavom karticom. Čak i na 365 / 720 MHz, Saphire Radeon 9700 nije prikazivao veliki broj anomalija u 3D aplikacijama. Pogledajmo sada koliko su veći ionako fantastični rezultati.
Preko sedamnaest hiljada poena u rezoluciji 640 x 480 i preko 15000 u default testu. Sve to na Athlon XP 2100+ sistemu sa malo povećanim memorijskim bandwidth-om (333MHz FSB). Zaista sjajni rezultati. Što je najbolje, sve ovo radi potpuno stabilno, a drajveri su u quality modu (default). Sa performance setovanjima, postigli smo i rezultat od preko 18000 u najnižem grafičkom modu (640 x 480, 16-bit).
FSAA performanse
Ako neko i koristi Full Scene Antialiasing, od sada je bolje da to čini na Radeon 9700 kartici. Gubitak je prihvatljiv čak i u 1600 x 1200, a kvalitet je prevaziđen jedino sa GeForce 4 Ti 4xS Supersampling algoritmom, i to samo ako sliku uhvaćenu u igri uvećamo u ACDSee programu, a zatim uvećamo na 300%.
Pogledajte sivi i žuti bar – zaista velika razlika, koja se kreće od 35% do gotovo 50% u najvišoj rezoluciji. Direct X9 generacija kartica je dovoljno zrela da bi FSAA bio 100% upotrebljiv.
Anisotropic performanse
Ponovićemo još jednom rečenicu: “Kada se jednom naviknete na anisotropic filtering, nema povratka na trilinear”. Za nas, vraćanje na bilinearno filtriranje bilo bi ravno vraćanju sa bilinearnog moda, na point sample, odnosno na isključeno filtriranje tekstura. Sećate li se još 3D igara koje su radile bez 3D akceleracije. Da, čini se tako davnim. Radeon 9700 omogućava anisotropic najvišeg nivoa, bez velikog gubitka performansi. Uostalom, pogledajte u tabelama.
Slično kao i sa FSAA rezultatima, s tim što se za Radeon 9700 ovoga puta zaista može reći da mu ni maksimalni anisotropic nivo ne oduzima mnogo od početne vrednosti. Pogledajmo sada, kako dva ljuta konkurenta na plećima podnose oba “enhancement-a” odjednom.
FSAA + Anisotropic performanse
Da li je komentar potreban? Ne, ali je potrebno videti 3DMark Nature scenu u najvišem modu sa uključenim anisotropic-om i antialiasing-om.
Zaključak
ATI Radeon je napravio pre svega velikog i uspešnog konkurenta – trenutnog lidera u gotovo svim kategorijama. Poboljšanja u drajverima su vidljiva, žao nam je samo što nismo mogli da ih prikažemo, ali ćemo nezvanično reći da je GeForce 4 Ti4600 pobeđen i u StarWars Jedi Knight II igri, a i u gotovo svim delovima SpecViewPERF-a. Radeon 9700 je zaista moćna kartica, te ako u ovom trenutku želite najbolje – ne zavaravajte se da je to GeForce 4 Ti4600. Odličan 2D, overklokabilnost, mogućnosti, kao činjenica da R300 tehnologija tek treba da pokaže šta može i ume, garancija su da Radeon 9700 Pro neće dugo zastareti. Možemo čak reći da će biti aktuelan i kada se GeForce 5 pojavi (sve veće šanse su da će se nV30 ipak tako zvati). Radeon 9700 je izašao u pravi čas za ATI. Iako nema softverskih naslova kojima je vidno potreban, entuzijasti će ga sigurno nabaviti u nedostatku nV30 baziranih kartica. Oni koji cene pre svega kvalitet, i to u zahtevnim igrama kao što je Unreal Tournament 2003, tipovaće na novu ATI-jevu karticu najviše zbog visokog frame-rate-a u modu 1600 x 1200 sa 4x FSAA i 8x anizotropnim filterom tekstura. Sledeća stvar koja bi mogla da nas iznenadi, pored novog nVidia GPU-a, jeste Radeon 9900, izrađen u 0.13 mikronskom procesu, sa DDR II memorijom i višim radnim taktovima. U tom slučaju, već za proleće, nVidia je najavila nV35, ali nas prvenstveno zanima koliko i kako će se kretati tržište high performance grafičkih kartica u veoma bliskoj budućnosti.
Karticu Saphire Radeon 9700 smo na test dobili od firme Japicom iz Novog Sada. Ovom prilikom im se zahvaljujemo.