Branko Maksimović
ATI Radeon X1800XT, X1800XL, X1600XT, X1300Pro review
Uvod
ATI Technologies je kompanija kojoj je za svojih dvadeset
godina postojanja uspelo da postigne zaista mnogo. Prvi veliki OEM proizvođač
grafičkih akceleratora za velike brendove poput IBM-a, Compaq-a ili Toshibe
u vreme kada je nVidia poslovala pod okriljem kompanije SGS-Thompson i kada
svet nije znao ne samo šta su GeForce i Radeon, već ni šta je i kako bi izgledala
hardverska akceleracija simuliranog 3D prostora. I nakon dvadeset godina, nakon
obaranja mnogo rekorda, različitih krunisanja, teških trenutaka i momenata
slave, slovo je spalo na dve kompanije čija je trka za veći tržišni procenat
možda i najzanimljivija u celoj IT industriji. U periodu koji prethodi premijeri
predstavnika nove generacije možemo čuti dosta različitih, obično neproverenih
informacija – ljudi su bili i ostali vrlo radoznala bića, kao da je želja za
prosperitetom i nečim novim, boljim, utkana u sve nas da nam čak i brži, moderniji,
moćniji 3D akcelerator za PC računare znači više nego što bi bilo logično –
na kraju krajeva, nova tehnologija će omogućiti da igre koje čekamo ili trenutno
igramo izgledaju bolje ili uopšte funkcionišu kako su to programeri i dizajneri
zamislili, programi koje mnogi od nas koriste će raditi brže, projekti na kojima
radimo će jednostavno biti bolji, a mi ćemo u poslu biti rasterećeniji, u trenucima
zabave opušteniji i zadovoljniji. Ako nas modernija tehnologija čini srećnijim,
zar ne bi trebalo tehnologiju učiniti boljom?
Da bi tehnologija mogla da napreduje, potrebno je da krajnji proizvodi budu
veoma komercijalni – SLI i Crossfire kao koncept ne bi mogli da zažive bez
podrške velike baze korisnika; ranije je to bio T&L, sutra će to biti Unified Shader arhitektura.
Možda će prvi izdanci te tehnologije izgledati kao nepotrebna novotarija, te
će ih u prvoj “turi” svi častiti komentarima tipa “nepotrebno” ili “samo žele
da izmisle nešto novo i uzmu novac”, no stvar je u tome da je svim korisnicima
računara potrebna bolja grafika, brži CPU, više memorije. Windows Vista će
za potpunu funkcionalnost grafičkog interfejsa zahtevati GPU koji može da izvršava
DirectX 9 set instrukcija, a neki naredni bi mogao da traži 3D akcelerator
sa Unified Shader arhitekturom, a dalje u budućnosti i GPU
koji može da izvršava multi-purpose kalkulacije. Ako se setimo da je Windows
95 radio sa VLB karticama koje su imale jedan megabajt lokalne memorije, a
da samo deset godina kasnije, novi OS zahteva DirectX9 Shader “monstruma”,
jasno je koliko brzo grabimo unapred.
U tekstu koji sledi, imaćete priliku da čitate o novoj 3D arhitekturi kompanije
ATI Technologies, opise sve tri klase nove Radeon X1000 familije akceleratora,
pogledate njihove performanse i uporedite ih sa nekim 3D karticama sa kojima
smo već imali prilike da se “družimo”. Ekskluzivno za čitaoce Benchmark sajta,
tu je i reportaža event-a koji je ATI upriličio za grupu izabranih novinara
iz evropskog regiona. Pa, da počnemo…
BEACHmarking – Ibiza 2005
Posao IT novinara je ponekad veoma naporan. Da bi čitaoci mogli da dobiju
pravu informaciju, neophodno je proučiti ogromnu količinu materijala, testirati
hardver u velikom broju aplikacija, uporediti je sa drugim adekvatnim hardverom,
postaviti sve “na papir” i prezentovati ga u čitljivom obliku. “Prednost Web
sajtova leži u činjenici da se tematika predstavlja daleko detaljnije, pa je
samim tim i posao obimniji. Više grafikona, teksta i slika će pomoći strpljivim
čitaocima da dođu do određenog zaključka, a ostali uvek mogu da preskoče na
poslednju stranu. No, tu su i momenti koji su vezani za sam posao, ali imaju
više zabavnih elemenata nego što se to može predpostaviti. Najbolji primer
za to je ATI-jev R5xx Series World Launch Tour, koji je počeo prvim eventom
u San Francisku, Sjedinjenim Državama, održan 21. i 22. septembra, nakon koga
je usledio evropski, sa španskim ostrvom Ibiza kao mestom dešavanja, dok je
6. oktobra počela poslednja manifestacija za novinare sa dalekog istoka, u
glavnom gradu države Japan , Tokio.
Novinari časopisa “PC” izdavačke kuće PC Press, magazina “Digital!”, TV emisije
“e-TV” i sajta “Benchmark”, imali su prilike da učestvuju u eventu koji je
ATI upriličio na ostrvu Ibiza, koji je sastavni deo Balearskih Ostrva, smeštenih
u Mediteranskom moru, jugoistočno od španske obale. Ibiza je pre poznata kao
mesto za lud provod (nego kao mesto za održavanje novinarskih konferencija),
a Ibiza City često nazivaju “gradom greha”, pa je ceo ATI BEACHmarking event
održan na zapadnoj strani ostrva, u kompleksu hotela koje je pravo mirno mesto
za relaksaciju i odmor, dalje od gradske buke i glasnih diskoteka koje organizuju
danonoćne žurke.
Da bi uopšte putovali u Španiju, potrebno je dobrano se pomučiti da bi dobili
vizu. Iako je ova zemlja članica Evropske Unije, a nemački ili austrijski
Schengen je daleko lakše dobiti, novinarima je bila neophodna upravo viza
koju izdaje ambasada Španije, a koju, da bi dobili, morate predati ogroman
broj dokumenata, čekati u posebnim redovima u različitim periodima za dobijanje
pozivnog broja, predavanje zahteva za vizu, donošenja dodatnih papira (koje
svako uvek donosi) i konačno dolaska po samu vizu. Nakon nekoliko dana neizvesnosti,
ekipa novinara iz Srbije je bila spremna da otkrije tajne dobro čuvane ATI
R5xx arhitekture i… noćnog života na Ibizi, o kome smo svi toliko slušali.
Put do Balearskih Ostrva nije toliko jednostavan kada putujete iz Srbije.
Lufthansa vas vodi u sam centar evropske avio-raskrsnice, frankfurtski aerodrom,
nakon koga se istim avio prevoznikom leti do Madrida i konačno, u Ibiza City
. Ponekad nije baš sve tako jednostavno i nama se desilo da let iz Beograda
kasni (jer Srbi dolaze na boarding 45 umesto 90 minuta pre leta), te nismo
mogli odmah preći na sledeći let i provesti celo popodne u Madridu. Tako smo
i u Frankfurtu i u Madridu imali dovoljno vremena da nam dosadi šetnja po terminalu,
ali nedovoljno da bi izašli u grad. Sva sreća pa je kupovina karticom takva
da nemate osećaj koliko trošite, a u shopovima ima svega… od Apple iPod Nano
plejera do Zippo upaljača sa žigom glave premijera Toni Blera (??). Moramo
priznati da nas je frankfurtski aerodrom (po veličini se može meriti samo sa
kalifornijskim LAX-a i njujorškim J.F.K) impresionirao, čitavih pet sati nije
bilo dovoljno da se obiđe. Treba li pomenuti da ovaj grad-aerodrom ima sopstveni
laki metro, tri posebne i tri pomoćne piste, gotovo dve stotine terminala i
na hiljade zaposlenih? Drugi momenat vredan pažnje je udobnost Airbus A320
i A321 mlaznjaka, pogotovo modela A321-200 koji poseduje TFT ekrane koji sve
vreme prikazuju lokaciju aviona, procenjeno vreme do sletanja, visinu, brzinu,
spoljašnje temperature na različitim visinama… Iako je bilo veoma toplo, na
Alpima uvek ima dosta snega, što ćete lepo možete videti na fotografijama.
Nakon najkraćeg leta na relaciji Madrid – Ibiza , putovali smo nekih dvadesetak
kilometara sa istočne na zapadnu stranu ovog malog ostrva. Prvo veče na Ibizi
proteklo je u okupljanju novinara iz cele Evrope, dok su momci iz ATI-ja, uključujući
i našeg Ivicu Stankovića neprestano i do narednog jutra radili na spremanju
svega što je potrebno za prezentacije. Novinari sajtova kakvi su Guru3D, iXBT,
Beyond3D i dr. zajedno su pili sa koktele sa Vojom Gašićem, Nedeljkom Kovačevićem
i mojom malenkosti, a najviše gužve je bilo oko Fuada Abrazovića sa sajta TheInquirer,
koji se (pre)često pominje i na našem forumu.
Ujutru nas je dočekala prijatno visoka temperatura (u Beogradu je u to vreme
bilo ispod pet stepeni Celzijusa), koja je dostigla trideseti podeok u toku
dana. Idealno za kupanje u prelepom bazenu u okviru hotelskog kompleksa ili
na obližnjoj plaži, no novinare je više od kupanja interesovalo po čemu je
to posebna R5xx arhitektura. Predavanja koja su usledila, bila su verovatno
nešto najzanimljivije što je gorepotpisani do tada imao prilike da sluša. Nisu
to bila samo stereotipna iznošenja podataka sa jasnom porukom “naš GPU je bolji”
+ gomila marketinških fraza i vešto zamenjenih teza), već se celoj stvari prišlo
sa tehnički dobro prezentovanom i vrlo odmerenom količinom razumljivih predavanja,
začinjenih sa solidnim brojem odgovarajućih šala i dosetki, video inserata,
grafički fenomenalno spremljenih PPT prezentacija.
Prvog oktobra, u devet časova ujutru, nakon doručka, su usledila predavanja
– bez ikakvih zakašnjenja. ATI je svim prisutnim podelio “R5xx briefing documents”,
veliku crvenu fasciklu u kojoj se, gle iznenađenja, nalazilo šest bočica Gordon’s
Dry Gin-a. U pozadini sale, bili su postavljene flašice Schweppes Tonica za
okrepljenje novinara ali i samih predavača. Baš kako kaže onaj simpatični “tigrić”
u reklami – “reska penušavost Švepsa” 🙂
Prisutnima se prvo ukratko obratio Chris Hook, koga i ovdašnja IT javnost
već solidno poznaje. Gospodin Hook, Head of PR za EMEA region, ispričao je
anegdotu o prenošenju opreme neophodne za ceo event. I nešto tako jednostavno
kao što je prevoz robe u okviru Evropske Unije lako može da se iskomplikuje…
Rich Heye, Vice President i General Menager Desktop Business odeljenja, ispričao
je uvodni deo u kome je dat osvrt na ATI-jeva dostignuća u prethodne dve decenije,
naravno, sa posebnim akcentom na Radeon familiju. Prisutni su onda premijerno
mogli da vide treću epizodu serije sa heroinom Ruby (The Assasin), ali i čuju
o čemu će slušati u narednim prezentacijama.
Prezentaciju o 3D arhitekturi Radeon X1000 familije, držao je “Sir” Eric Demers,
što je i logično jer je gospodin “3D architect and hardware design manager”
u ATI Research odeljenju smeštenom u Silikonskoj Dolini, u saveznoj državi
Kalifornija. O ovome ćemo, naravno, detaljno pisati na narednim stranama ovog
teksta.
O novoj memorijskoj arhitekturi, odnosno magistrali novih Radeon GPU-ova,
mogli smo da slušamo od čoveka koji je glavni inženjer i zadužen za razvoj
GDDR memorije – gospodin Joe Macri. Kasnije smo, uz još malo džin-tonika, imali
vrlo zanimljiv razgovor o GDDR3 i GDDR4 standardu, a razgovoru su se pridružili
Terry Makedon i Eric Demers i otkrili nam možda i više nego što je trebalo.
Nakon priče o Ring-bus arhitekturi, ATI-jev Senior Architect, gosp. Raja
Koduri nam je ispričao vrlo zanimljivu i animacijama dobro podržanu priču
o kvalitetu slike koje nude Radeon akceleratori (praktična objašnjenja zbog
čega su, npr. HDR i Adaptive AA bitni za igranje next-gen igara), a gosp.
Alexis Mather, menadžer tehničkog marketing odeljenja nam je pričao o ATI
“AVIVO” tehnologiji, o kojoj ćemo i mi oprširnije pisati.
Posle vrlo ubedljive gozbe u restoranu hotela, gospodin Richard Huddy, u
ATI-ju zadužen za odnose sa developerima nam je pričao kako se “rešavaju
praktični problemi”, sa developerima, ali i devojkama. Naime, ovaj harizmatični
Englez nam je dao nekoliko saveta za “muvanje”, ali samo u slučaju da se
mnogo “ložimo” na 3D grafiku. Ovaj deo prezentacije, nazvan “Dating Tips
for Geeks”, nećemo pokušati da prepričamo, ali je, verujte, svima nama bilo
veoma smešno (iz očiglednih razloga). Pored toga, gosp. Huddy je pričao o
prednostima Paralax Occlusion
Mapping tehnike u odnosu na klasičan Bump i Displacement mapping.
Terry Makedon, a.k.a. Catalyst Maker , je, narodski rečeno,
šef odeljenja koje pravi softver za ATI proizvode. Pored novina koje su
uvedene u Catalyst drajvere, bilo je zanimljivo saznati i neke druge informacije
o razvijanju OpenGL i D3D biblioteka, onome šta nas čeka u narednim mesecima…
Nakon priče o drajverima, mogli smo da čujemo i vidimo prezentaciju gospodina
Mike Hustona, researchera na katedri Univerziteta Stanford u Kaliforniji.
GP-GPU (General Purpose GPU) predavanje je uključilo i neke impozantne
rezultate testova u kojima se pokazuje nadmoć GPU-a u odnosu na trenutno
najjače desktop procesore, naravno, uz žestoku optimizaciju softvera.
Nakon pauze za kafu (i džin-tonik), David Nalasco, tehnički marketing menadžer
u kompaniji nam je pričao Crossfire tehnologiji i otkrio ono što smo ranije
predpostavljali odnosno ono čemu smo se nadali – nove Crossfire Editon kartice
će imati bolji Composition Engine (naš Crossfire review je izneo ovo kao
prvu i najveću manu ATI-jeve DualGPU tehnologije), koji neće imati ograničenja
na 1600 x 1200, već na daleko višoj, HD rezoluciji.
Richard Huddy je radio na još jednoj “Tips for Geeks” epizodi, ovoga puta
citirajući prave rečenice koje su njegove kolege iznosile, i postavljajući
ih u drugi kontekst (npr. “I’m really excited about 90-nanometers” ili “…ours
are 100 time smaller than theirs”. Za vašeg novinara verovatno najzanimljivija
prezentacija, govorila je o svakoj od tehnologija implementiranih u novi, izuzetno
impresivni Toy Shop demo, koji je kvalitetom nadmašio Pixar crtane filmove
od pre nekoliko godina (naravno u realnom vremenu). Ako bude interesovanja,
postavićemo hi-res video ovog demoa za download na naš server. Završnu reč
je opet imao gospodin Rich Heye, a novinari su bili spremni da odu do plaže
ili bazena i uhvate malo popodnevnog mediteranskog sunca.
Kasnije te večeri, nakon nekoliko koktela u hotelu, ATI je organizovao večeru
u restoranu diskoteke “Pacha”, nakon koje smo u ovoj čuvenoj diskoteci mogli
da slušamo Davida Moralesa i druge poznate DJ-eve. Atmosfera je bila takva da
prostor nismo napustili do osam ujutru, iako je sledeći dan bio predviđen za
“one on one” intervjue i praktičan rad sa Radeon X1000 karticama. Izvinjavamo
se što nema mnogo slika iz diskoteke – neke su jednostavno morale da budu cenzurisane
J . Neki su i naredne večeri posetili diskoteku “Space” u kojoj je žurka trajala
24 časa i bila direktno emitovana na MTV – nemojte misliti da u devet ujutru
ili tri sata popodne nikoga nema u diskoteci. Ulice i plaže su puste, a diskoteke
nikako!
Novinari iz Srbije su u naredna dva dana posetili San Antonio i čuveni Café
Del Mar, u kome je poseban doživljaj posmatrati zalazak sunca. Evo i nekoliko
fotografija snimljenih Canon S2 IS aparatom.
ATI-jev PR menadžer za Jugoistočnu Evropu nam je pre svog polaska (mi smo
ostali još jedan dan :), ostavio celu familiju kartica na test, te smo svaku
od njih detaljno testirali, a nakon proučenog materijala, imamo mogućnost da
i čitaocima prenesemo utiske sa testiranja, konkretne rezultate, uz poseban
osvrt na novu tehnologiju. Još jedna slika, a onda krećemo sa našim
review-om…
R5xx background
Mnogima je verovatno poznato da su Radeon 9700, 9500 i 9200 kartice bile uspešne
i da su povećale reputaciju (i cene akcija) kompaniji ATI (u vreme kada je
nVidia imala problema sa nV30 čipom i njegovim derivatima), ali je isto tako
mnogima poznato da je na ovoj arhitekturi ATI bazirao narednu generaciju, nazvanu
X800, dok su derivati samo dobijali PCI-E obeležje, gotovo ne promenivši dotrajalu
Shader Model 2.0 zaostavštinu. Proizvodni proces je poboljšan, povećan je broj
pixel i vertex shader jedinica, ubačeno je dosta promena i verovatno izvučen
maksimum iz postojeće tehnologije, te smo svi znali da je vreme za nešto novo,
pogotovo što je nVidia već neko vreme bila prisutna sa potpuno osveženom familijom
akceleratora – GeForce 6. ATI je uspeo, još neko vreme, da uz poboljšanje proizvodnog
procesa i tweak -ovanje jezgra, postigne više frekvencije, vrlo dobar yield i
prihvatljivo niske cene u proizvodnji, ali je imao i nekoliko loših poteza
u mainsteam segmentu, jer se na odgovor na veoma uspešni GeForce 6600GT predugo
čekalo. ATI je, može se reći pomalo prerano izbacio čitavu familiju PCI-Express
kartica, sa ciljem da se nađe u velikom broju OEM konfiguracija (uz predpostavku
da će tranzicija na novi standard biti veoma brza), a koje nisu imale adekvatne
pandane na AGP platformi, što bi bilo u redu da je Radeon 9800 Pro bio dostupan
onoliko koliko i Radeon 9200 ili 9600. Tako smo u jednom dugom periodu, kada
je retail tržište u pitanju, bili osuđeni ili na modele 9600 Pro
i XT, ili na Radeon X800 Pro, uz jaz od čitavih 250 evra između njih. PCI-E
to AGP bridge čip Rialto je stigao dockan, pa su R423 AGP kartice stigle već
kada su GeForce 6600 GT i 6800/LE postale uobičajen izbor u nižem segmentu performance klase.
Radeon X850 XT PE, iako teško dostupan u prodaji, uspeo je da ATI-ju zadrži top
performance titulu, te je jedini odgovor iz nVidie bio DualGPU SLI
sistem, u početku praćen problemima, a danas gotovo standardan u igračkim
mašinama najviših klasa. U drugoj polovini prošle godine, dok su mnogi još
uvek raspravljali da li nam je GPU koji može da radi sa izuzetno dugim Shader
Model 3.0 programima, izvršava dinamičko grananje i loop-ove, uopšte potreban,
u ATI-ju se uveliko radio na sledećoj generaciji 3D akceleratora, za koga
smo prvi put čuli u septembru 2004., a koji je i tada bio poznat samo kao
“Fudo”. R420, kako mu je interna oznaka, bio je prekriven velom misterije.
Nismo bili sigurni ni da li se radi o Shader Model 3.0 procesoru, koliko
će pixel, vertex i render output jedinica imati, koliko će imati zajedničkih
tačaka sa prethodnom generacijom… Sve što smo mogli da čujemo, bila su samo
nagađanja. Prethodne godine, ATI je napravio ugovor sa Microsoftom i potpuno
drugi tim je počeo da radi na grafičkom procesoru za Xbox 360 igračku konzolu.
Xenos, kako glasi komercijalno-radni naziv ovog čipa, biće izuzetno napredan,
u šta nas je još 25. maja ove godine, u sred Beograda, uveravao Richard Huddy,
ATI-jev menadžer za odnose sa developer -ima. Pominje se on-die
memorija, unified shader arhitektura i veoma visoke performanse,
ali se ovaj GPU ne može lako uporediti ni sa čim što smo u tom trenutku mogli
da vidimo na PC računaru, te je svako poređenje bilo deplasirano.
Kada smo početkom ove godine prvi put dobili nezvanične informacije o novom
GPU-u, očekivali smo da će se on na tržištu pojaviti najkasnije tokom leta.
Ništa konkretno se nije dogodilo ni kada je nVidia predstavila G70, kao i na
opšte iznenađenje tržišnu dostupnost na njemu baziranih kartica – direktno
iz ATI-ja nismo mogli da dobijemo preciznu informaciju. TSMC, koji proizvodi
novi GPU za ATI, naišao je na određen broj problema sa “curenjem” u prvih nekoliko tape – out -a
R520 procesora. Navodno, pri prvom i drugom pokušaju, uz neverovatno nizak
broj primeraka koji su mogli da rade na 600+ MHz, problem kod onih koji su
uopšte ispravni, bio je u nemogućnosti da rade (stabilno) na naponu od preko
1.15 volti, što je nedovoljno za frekvencije preko 350-400 MHz (R520 u najjačoj
varijanti ima radni napon od 1.35V). Iz trećeg tape-out -a je izvučen
dobar broj upotrebljivih primeraka, dok u četvrtom pokušaju nije bilo problema,
te je aktuelna verzija R520, kako tvrde Joe Macri, glavni inženjer i Raja Koduri,
senior architect, čak i nadmašila očekivanja (o čemu smo mogli da čitamo u
vestima prethodnih dana). Problem nije samo u osvajanju 90-nm proizvodnog procesa
već i u samom načinu na koji se arhitektura sa “papira” prebacuje na silicijum
(specifikaciju daje sam ATI). Mnogi bi mogli da predpostave da ATI sa jednostavnijim
čipovima nije imao problema, te da su RV515 i RV530 prošli bez ikakvih problema,
ali to nije slučaj. RV530, koji poseduje isti memorijski kontroler kao i kompleksniji
brat, je takođe zadavao glavobolje odgovornima u kanadskoj kompaniji, dok je
RV515, koji je nešto drugačiji, prebačen u proizvodnju bez problema.
R5xx arhitektura – Pixel Shader
Kao što smo mogli da predpostavimo, R5xx nije po arhitekturi potpuno drugačiji
od R480 video procesora, ali se od njega razlikuje makar onoliko koliko se
nV40 razlikovao od nV30, što je sasvim u redu jer je R480 daleko bolja polazna
tačka nego što je to bio “čuveni” FX5800. Ovo nije samo zbog činjenice što
R520 ima preko 300 miliona tranzistora i može da radi sa dugim Shader Model
3.0 programima, već zbog popriličnog redizajna arhitekture na nivou pixel i vertex shadera,
na nivou njihove međusobne organizacije, memorijskog kontrolera… U jezgro je
dodat veliki broj korisnih novina, od kojih bi u samom startu izdvojili “Ultra
Threading Dispatch Processor”. Šesnaest pixel shader jedinica je su i dalje
organizovane u QuadUnit-e, iz brojnih razloga o kojima smo ranije detaljno
pisali. Najbitnija novina ATI R5xx familije procesora je implementacija Shader
Model 3.0 seta, ali baš onako kako bi to trebalo, što posebno ističu u ATI-ju.
Za SM3.0 je, kao što znamo, karakteristična 128-bitna floating point preciznost,
32-bita za svaki od četiri RGBA kolor kanala. Novi ATI GPU-ovi uvek rade interno
uz 32-bit preciznost, čak iako je format tekstura 16-bitan, što je razlika
u odnosu na GeForce 6 ili 7 video procesore. Pogledajmo uporednu tabelu:
Kako smo ranije predpostavljali, a nedavno saznali da je činjenica, nijedna
igra koja je do sada izašla, a koristila Shader Model 3.0 render-path nije
zapravo iskoristila ni blizu onoga što njegova specifikacija može da pruži.
U najvećem broju slučajeva, upotreba SM3.0 je obezbeđivala više performanse,
jer je veliki broj shader instrukcija mogao biti obrađen u jednom prolazu,
dok su / bi u slučaju standardnog SM2.0 bila potrebna bar dva prolaza. Upotreba
još kompleksnijih shadera bi onemogućila ili otežala izvršavanje istih uz limite
SM2.0 specifikacije, te bi performanse poprilično opale i animacija pala na
neupotrebljiv nivo.
Upravo je zbog toga, najnovija R5xx familija GPU-ova obogaćena sa pravom
Shader Model 3.0 logikom, koja omogućava rad sa daleko kompleksnijim shader
programima, dinamička grananja i looping do 512 paralelnih thread -ova
(zapravo, X1600 i X1300 su ograničeni na izvršavanje maksimalno 128 paralelnih thread -ova)
. ATI se ovoga puta fokusirao i na bolju podelu posla u okviru samog GPU-a;
već smo u tekstu G70 GPU-a dali primer o tome da i prilikom podele posla
dolazi do smanjenja efikasnosti, de da bi u praksi, Radeon R420, npr, sa
osam aktivnih pipeline jedinica na 500 MHz bio efikasniji nego kada svih
16 pipeline-a rade na 250 MHz. Žestok paralelizam svakako ima svojih mana,
a ATI-jevo rešenje za ove probleme se naziva Ultra Threading (slično
Intel-ovom Hyper
Threading -u, bar sa marketinškog aspekta).
Radeon X1800 GPU je, sa jedne strane, vrlo sličan R3xx i R4xx procesorima,
ali pozajmljuje i brojna rešenja iz Xenos čipa, koji ATI sprema za Microsoft
X-Box 360 igračku konzolu. R520 poseduje poseban koprocesor zadužen za optimalnu
distribuciju pixel-load-a između Quad Pipeline jedinica, koji se naziva Ultra-Threading
Dispatch Processor. To postiže tako što grupe piksela deli u pakete od
4×4 piksela i šalje ih redom u Quad Pipe Unit -e. Prioritet imaju
jedinice koje su imale prazan ciklus, a ATI tvrdi da Dispatch Processor ume
da prepozna i “prazan hod” jedne pipeline jedinice u okviru svakog Quad Pipe-a,
te da im prebaci narednu kalkulaciju kako bi efikasnost bila povećana. Ako
je za kompletno izvršavanje shadera neophodna informacija koja još nije stigla
do Dispatch Processor-a, isti će zaustaviti izvršavanje thread-a time oslobađajući
ALU resurse koji odmah kreću sa kalkulacijama iz drugih thread-ova. Započeti
thread će biti zabeležen u registar, a maksimalan broj 128-bit (32-bita po
komponenti) piksela koji se „u letu“ mogu čuvati je 32. U slučaju da Dispatch
Processor -u nedostaje prostora za beleženje, DP će automatski smanjiti
broj aktivnih thread- ova, što je efikasnije od slanja poluzavršenih
tredova u lokalnu memoriju. Ograničenost registar memorije je jedna od mana
koje će biti otklonjene povećavanjem on-die memorije na nekoliko megabajta
(koja se može posmatrati kao L3 cache), slično Xbox360 Xenos GPU-u.
Brzo žongliranje između thread-ova zahteva postojanje posebnih registara,
koje ATI naziva General Purpose Register Array . Kako je broj thread-ova
koji se izvršavaju istovremeno povećan, a veličina thread-a ograničena na 4×4
piksela, R5xx GPU-ovi su izuzetno efikasni u dinamičkom grananju – daleko ispred
konkurencije. Igre se još uvek ne oslanjaju toliko intenzivno na dinamičko
grananje, ali je trend takav da će uskoro biti sve više dugačkih shader programa
sa dosta loop i branching figura. SM3.0 flow control omogućava
izvršavanje brojeva sa pokretnim zarezom uz 128-bitnom piksel formatu – uvek
i u svakoj situaciji.
Upotreba trikova pri izradi igara (pamet umesto mišića, odnosno pixel trikovi
umesto žestoke geometrije), podrazumeva opterećenje Pixel Shader jedinica i
Toy Shop demo koji je ATI predstavio je odličan primer za to. Na jednom od
slajdova smo mogli da primetimo koliko se dizajneri u novim igrama (Half Life
2, npr.) intenzivno oslanjaju na alfa teksture, LOD sistem (praktično 90% udaljene
geometrije više nisu objekti već dobro zamaskirane teksture) ili bump odnosno normal mapping .
Ako se broj vertex jedinica ne povećava u velikoj meri, onda se svakako
mora povećati efikasnost pixel unit-a. Ove jedinice su u okviru G70
GPU-a napredovale u odnosu na one kod nV40, a kod R520 su još naprednije. Svaki
pixel procesor poseduje dva skalarna i dva vektorska aritmetičko logička kola,
od kojih je svaki sposoban da izvrši četiri instrukcije po klok-ciklusu (uglavnom
se radi o tipičnim MADD / MUL tipovima instrukcija). Dakle, novi pixel pipeline
je bogatiji za dodatni Texture Address ALU Unit.
Kod R520 je značajno smanjena latencija između jedinica za mapiranje i jedinica
za adresiranje tekstura, jer se obe obraćaju direktno Ultra-Threading Dispatch
Processor- u, te ne moraju čekati jedna na drugu. Ovo je vrlo bitno za
GPU koji bi trebalo da radi na visokim učestanostima. nVidia tvrdi da u okviru
G70 GPU-a postoji hardverski logički procesor koji obavlja menadžment thread -ova,
ali se o njemu vrlo malo zna, pa predpostavljamo da se cela stvar izvršava
više na nivou drajvera nego u samom GPU-u. Kako je ATI dobro pokazao zbog čega
je rad sa manjim blokovima piksela efikasniji, očigledno je da je tred u smanjenju
ovih blokova prisutan i kod nVidie. Naime, shader jedinice kod nV40
su baratale sa tred-blokovima od ukupno 4096 piksela, dok G70 radi sa četiri
puta manjim pixel thread -ovima (što je opet značajno veće / drugačije
od ATI-jevog principa). Međutim, rad sa manjim piksel blokovima ne znači i
srazmerno višu efikasnost; od developera zavisi kakav će shader napisati i
kako ga optimizovati. Jako mala veličina treda omogućava i rano izbacivanje
nevidljivih piksela (“early out”), što dodatno povećava efikasnost Z-jedinice.
R5xx familija procesora
ATI je odlučio da odmah predstavi tri čipa za tri različite kategorije akceleratora
i izbegne varijante u kojima je jači GPU sa “prepolovljenom” magistralom i
manje aktivnih pipeline-a, pogon za mainstream klasu kartica. Tako su dizajnirani
i RV515 i RV530, koji su “zvezde” modela Radeon X1300 i X1600. RV530 je dobar
indikator trendova kojim se kreće 3D grafička industrija za desktop računare.
Poseduje 12 pixel shader jedinica, ali i čitavih osam vertex unit-a,
s toga vrlo pogodan za rad sa modernim naslovima koji se oslanjaju na upotrebu
shader-a, ali i na one koji imaju kompleksnu geometriju / sistem osvetljenja
i prema prvim procenama, očigledno nešto inferiorniji u starijim igrama koje
se oslanjaju na klasičan texturing ili u situacijama kada je primenjen visok
nivo AF i AA semplinga. Kao što ćemo kasnije videti, R520 i RV530 imaju veoma
sličan memorijski kontroler (Ring Bus), s tom razlikom što jači GPU sa njim
ima internu komunikaciju od 512 bita i 256-bitni “put” ka čipovima, dok novi
akcelerator srednje klase ima 128-bitni bus sa kojim komunicira internim bus-om
širine 256 bita. Najjednostavniji u familiji, RV515 čip ima tradicionalnu arhitekturu
memorijskog kontrolera i podržava komunikaciju kroz jedan, dva ili četiri “segmenta”
crossbar kanala širine od 32-bita, u zavisnosti da li će kartica koristiti
32-bitni ili 64-bitni mem. bus (HyperMemory izdanja), ili će to biti “full”
izdanje sa 128-bitnom magistralom, kao što je to model sa testa – Radeon X1300
Pro.
Radeon X1800 (R520) GPU je najkompleksniji 3D procesor koji se proizvodi.
Bez obzira na manji broj pixel i vertex jedinica, procenjuje
se da se ovaj GPU sastoji od oko 321 miliona osnovnih poluprovodničkih elemenata,
za oko 20 miliona više od nVidia G70 procesora. Površina jezgra je 263 mm 2
, dok je površina jezgra direktnog konkurenta čitavih 333 mm 2 , što je i logično,
obzirom na to da je izrađen u starijem, 110-nm proizvodnom postupku.
RV530 u sebi “krije” oko 157 miliona tranzistora, a površina jezgra je dvostruko
manja i iznosi 132 mm 2 , što mu omogućava daleko niže cene u proizvodnji.
Iako ima još dva Quad Pipeline Unita manje, RV515 ima samo 50 milona tranzistora
manje “u jezgru” (105 M), a površina die-a iznosi 95 mm 2 , što je samo malo
manje od X1600 GPU-a. Poređenja radi, GeForce 6200 GPU (nV44), ima površinu
tek nešto veću od 100 mm 2 , zahvaljujući činjenici da u jezgru ima svega 70-ak
miliona tranzistora. Očigledno je da je izmena arhitekture ( Ultra-Threading
Dispatch Processor) i svake pixel jedinice ponaosob (dodatni Texture
Address ALU Unit), dobrano podiglo kompleksnost GPU-a, te su i najjeftiniji
procesori za kartice koje bi trebalo da koštaju i dosta ispod $100, poprilično
kompleksni. Stotinak miliona tranzistora su nedavno imali GPU-ovi najviše klase,
zar ne? Pogledajmo komparaciju arhitekture sva tri nova ATI GPU-a.
Vertex Shader
ATI R520 i dalje ima “klasične” vertex shader jedinice, i to osam njih, što
nije promena u odnosu na R480 (Radeon X850 XT PE), ali je za 20% manje u odnosu
na GeForce G70. a njihova organizacija se interno ne razlikuje mnogo od one
kod R480 ili R420 procesora. Podsećanja radi, Vertex Engine se sastoji
od četvorokomponentnog Vektorskog ALU unit-a, sa pridruženim ALU-om za skalarne
operacije sa punom FP32 preciznošću. Zahvaljujući proširenoj SM2.0b specifikaciji,
prethodna generacija Vertex jedinica je imala mogućnost geometrijskog
instanciranja u hardveru, dok je uz proširenje na Shader Model 3.0, ova mogućnost
potpuno “legalna” sa Direct3D aspekta.
Svakako, spisak mogućnosti svake komponente Vertex jedinice je proširen, a
privremeni registri su izmenjeni i prošireni (povećani) pa je sada moguć dinamički
flow control sa grananjem, zaokretima i subrutinama uz maksimum na 1024 instrukcije.
ATI nije direktno naveo da li R52xx podržava Vertex Texturing, mada bi po specifikaciji
VS3.0 trebalo da ima ovu mogućnost. Jedna od mogućnosti koju ATI “uvodi na
mala vrata” jeste Render to Vertex Buffer (R2VB), koji je na pravi
način podržan i od samog DirectX API-ja (mada se lako implementira kroz OpenGL,
što je i logičnije jer je ovaj API mnogo direktniji u pristupu hardveru). Kroz
Direct3D, koji se najčešće koristi, programeri koji razvijaju igre bi morali
da obezbede podršku za različite R2VB formate, te obezbede drugačiji codepath
za akceleratore koji ne podržavaju ovaj Texture Lookup metod (a onda
se sve prednosti tog načina programiranja poništavaju – ako morate birati između
veće kompatibilnosti i veće slobode, izabraćete ono što će vam na kraju garantovati
uspešniji proizvod). R2VB vertex texturing implementacija u R520
procesoru je daleko bliža onoj kod Xenos GPU-a, pa je za sada prisutna samo
kao takva – ATI na svojim prezentacijama nije preterano ni pričao na ovu temu.
Nova memorijska magistrala
U ATI-ju su za potrebe R520 dizajnirali potpuno novi memorijski kontroler,
nazvan Ring Bus iz razloga što je smešten na obodima GPU-a kako bi se, pored
ostalih razloga, izbegao gust wiring ispod samog čipa, koji izaziva tzv. vruća
mesta i može da pravi probleme interferencione probleme osetljivim delovima
jezgra i onemogući visoke radne učestanosti.
Novi bus interfejs se sada sastoji od osam 32-bitnih kanala, nasuprot ranijim
rešenjima koja su podrazumevala četiri 64-bitna kanala. Novi prstenasti kontroler
se sastoji centralnog arbiter čipa i tzv. klijenata koji se nalaze okolo i
prave zahteve za informacijama. Na obodima čipa su smeštena dva 256-bitna prstena
kojima podaci “putuju” u suprotnim smerovima. To znači da je, interno, ukupna
širina memorijske magistrale 512-bita, ali je deo koji povezuje GPU sa memorijskim
čipovima i dalje sa ukupnom širinom od 256-bita. Podaci onda uvek putuju maksimalno
polovinu “prstena” jer će arbiter moći da proceni kojim će “putem / smerom”
paket stići pre. Na “prstenu” se nalaze četiri Ring Stop tačke na
koje podaci stižu sa ili odlaze u VRAM. Centralni kontroler memorijske magistrale
je programabilan čip čiji se parametri mogu menjati direktno iz drajvera. Novi
memorijski kontroler je, navodno, četiri puta efikasniji u slučajnom pristupu
memoriji. RV530 poseduje memorijski kontroler koji radi po istom principu.
Postoje dva različito usmerena “prstena” širine po 128-bita i 128-bitni interfejs
ka lokalnoj memoriji. RV515 ima klasičan crossbar memorijski kontroler koji
se od prethodnih rešenja razlikuje po tome što se sastoji od četiri 32-bitna
kanala, dok su oni ranije imali širinu od 64 bita. Zanimljivo zvuči činjenica
da je memorijski kontroler R520 već spreman za GDDR4 memoriju, ali i da podržava
rad sa DDR i DDR2 memorijama. Sigurni smo da će i R580 koristiti sličan memorijski
kontroler, a videćemo šta će se desiti sa narednom, R600 generacijom akceleratora.
HDR, Adaptive AA, Avivo, Z-Buffer …
Još jedna bitna karakteristika R520 GPU-a je njegova sposobnost za filtering
i blending FP16 tekstura što omogućava lakšu manipulaciju pikselom i upotrebu
High Dynamic Range efekata. No, ono što nVidia GeForce 7 akceleratori ne mogu
da postignu, jeste efektivni multisampling antialiasing u vreme kada se vrši
gamma korekcija blending operacije.
ATI-jev novi Adaptive Antialiasing je isto što i nVidia Transparency AA u
Supersampling modu. Kao što znamo, problem klasičnih Multisample antialiasing
algoritama je u tome što ne mogu da izađu na kraj sa nazubljenim ivicama kroz
celu teksturu, već samo na ivicama objekata. Adaptive AA, kao i Transparentni
kod G70 kartica je u stanju da “ispegla” i ivice na transparentnim teksturama.
Kada ovu funkciju primenite u samom drajveru (po defaultu je, naravno, isključena),
teksture koje imaju alpha kanale bivaju specijalno tretirane – pikseli na ivici
između alpha i color tekstura bivaju prepoznati i na njih se primenjuje supersampling .
ATI je takođe popravio i kvalitet anisotropic filtriranja koji sada u high
quality modu nije zavistan od ugla pod kojim se poligon nalazi i radi u pravih
16 nivoa.
Takođe, ATI Avivo display engine u R5xx seriji kartica, omogućava viši kvalitet
prikaza videa i videa visoke definicije. Korekcija kontrasta i boje se izvršava
kroz tone mapping algoritam koji se inače koristi kod prilagođavanja
HDR scene za prikaz na LDR mediju kakav je monitor. Avivo engine zapravo nije
poseban skup jedinica u GPU-u već se oslanja na postojeće Shader jedinice.
Preciznost obrade je povećana sa osam na 10-bitne integer vrednosti po kolornom
kanalu, a ATI ponosno ističe i akceleraciju H.264 kodeka koji se sve intenzivnije
koristi za prikaz HD video sadržaja.
U odnosu na prethodnu generaciju kartica, Hierarchical Z-Buffer sistem, o kome
smo više puta pisali, dodatno je poboljšan (možda je prigodnije koristiti termin
– redizajniran) i sposoban je da iskešira i do 60% više piksela nego R480.
Novi Crossfire i komentar
Kao što smo već hrabro predpostavili u našem testu Crossfire sistema, ATI
jednostavno mora da obezbedi bolji composition engine za novu seriju
kartica. Koncept nije promenjen, a čipset koji se koristi je ostao isti – Radeon
Xpress 200 Crossfire Edition, koji se pokazao kao veoma konkurentan nForce
4 SLI čipsetu, ako zaboravimo na niže performanse USB 2.0 porta. Najjače Radeon
X1000 kartice i dalje će dolaziti u Crossfire izdanju, a moći će da se “upare”
sa regularnim modelom istog čipa. Veza među karticama se i dalje odvija putem
eksternog kabla, a maksimalna rezolucija sada je 2048 x 1536 pri 72 Hz, što
je više nego što većina monitora može da pruži i sasvim dovoljno za High
Definition gaming, a ograničenje po pitanju SuperAA modova neće postojati
ni u najvišoj rezoluciji . Jedna od zanimljivih novosti je i mogućnost
povezivanja dve X1300 kartice u Crossfire sistem bez potrebe za master karticom
jer će one koristiti PCI-Express magistralu za međusobnu komunikaciju. Radeon
X1300 CE kartice takođe koriste SuperTiling, Scissor, AFR rendering
modove, a omogućen je i Super AA, mada je pitanje koliko će u tim situacijama
prepreka biti sama PCI-E magistrala. Composition Engine je, kako u ATI-ju navode,
programabilan čip koji se može podešavati prema potrebama iz samih drajvera.
Ruby Episode III i Toy Shop demo
Na prezentacijama smo premijerno mogli da vidimo dva nova, izuzetno impresivna
demoa Ruby: The Assasin i Toy Shop Town , koji je po mnogo čemu poseban.
Naime, Toy Shop koristi neke radikalne tehnologije koje jesu vezane za novine
koje donosi R520, ali su i odličan primer pametnog programiranja i dizajniranja.
Autor ovog teksta je zaista video mnogo naprednih 3D demoa, ali Toy Shop je
svakome ko se iole razume, ostavio utisak koji već godinama unazad nijedna
igra niti demo nisu. U demou se vidi simulacija dve ulice i nekoliko zgrada,
uz taksi koji prolazi pored i najveći broj detalja koje smo imali prilike da
vidimo u jednoj realtime 3D sceni. Gotovo svaki deo scene je posebno programiran
i dizajniran specijalno za ovu priliku, a fake momenata ima veoma
malo – mnogo je više onih koji i nakon više desetina minuta gledanja ne prestaju
da impresioniraju. Verujte nam, nimalo ne preterujemo sa ovim izjavama: ako
imate prilike, sedite za jedan Radeon X1800 XT i pokrenite Toy Shop demo. Verujemo
da ćete se složiti sa nama.
Simulacija kapi kiše na prozoru uz 100% ispoštovanu fiziku, talasa na barama,
refleksija, paralax occlusion mapirane površine (sa POM mapama visoke rezolucije),
uz realni vetar koji pomera žice na banderama… sve jednostavno izgleda kao
u visokobudžetnom CGI crtaću koji teži fotorealističnosti, a ne karikaturnoj
animaciji. I sve radi sa više od 40 fps u rezoluciji 1280 x 1024 i 8x AF na
najjačem Radeonu. Trebalo bi napomenuti da POM i ostale displacement mape koriste
sve blagodeti nove kompresije tekstura 3DC+, koja će u narednoj generaciji
Microsoft DirectX-a postati standardan i opšte prihvaćen algoritam, kao što
je to bio S3TC u prethodnoj verziji ovog API-ja. Toy Shop demo koristi preko
700 posebno napisanih shadera, od kojih je više od pola upotrebljeno samo za
simulaciju svih tečnosti.
Evo još nekoliko screenshotova iz ova dva demoa:
Zvanična specifikacija ATI Radeon X1800 GPU-a i prvi predloženi
modeli
Codename: R520
Process technology: 90 nm
320 million transistors (G70 has 302 millions)
FC package (flip-chip, flipped chip without a metal cap)
256 bit memory interface
Up to 1 GB of GDDR-3 memory
PCI
Express 16x
16 Pixel Processors
16 texture units
Calculating, blending, and writing up to 16 full (color, depth, stencil
buffer) pixels per clock
8 vertex processors
FP32 processing throughout the pipeline (vertices and pixels)
Full SM 3.0 support (Shader Model 3.0), including dynamic branching in
pixel and vertex processors, texture sampling from vertex processors, etc.
Effective branching
FP16 processing throughout the pipeline: arbitrary filtering for integer
and floating point FP16 textures (including anisotropy), full support for
FP16 output into a frame buffer (including any blending operations and even
MSAA). FP16 texture compression, including 3Dc.
New RGBA (10:10:10:2) integer data type
in a frame buffer for higher quality rendering without FP16.
New high-quality algorithm for anisotropic filtering (a user is given a
choice between a faster or higher-quality anisotropy options), improved trilinear
filtering
Support for "double-sided" stencil buffer
MRT (Multiple Render Targets — rendering into several buffers)
512-bit internal ring bus for memory reads (4 memory channels, programmable
intelligent arbitration logic).
Efficient caching and a new more effective HyperZ implementation
2xRAMDAC 400 MHz
2 x DVI interfaces
supporting HDCP as well as HDMI via an adapter
TV-Out and TV-In, HDTV-Out
Hardware video processor (for
video compression, decompression, and post processing), new generation that
can accelerate operations with H.264 — a new algorithm for video compression
used in HD-DVD and Blu-Ray video discs.
2D accelerator supporting
all GDI+ functions
ATI CrossFire support
Zvanična specifikacija ATI Radeon X1600 GPU-a i prvi predloženi
modeli
Codename: RV530
Process technology: 90 nm
157 million transistors
FC package (flip-chip, flipped chip without a metal cap)
128 bit memory interface (optional 64 bit configuration)
Up to 512 MB of DDR1/2 or GDDR-3 memory
PCI Express
16x
12 pixel processors
4 texture units (!)
Calculating, blending, and writing up to 4 full (color, depth, stencil
buffer) pixels per clock
6 vertex processors
FP32 processing throughout the pipeline (vertices and pixels)
Full SM 3.0 support (Shader Model 3.0), including dynamic branching in
pixel and vertex processors, texture sampling from vertex processors, etc.
Effective branching
FP16 processing throughout the pipeline: arbitrary filtering for integer
and floating point FP16 textures (including anisotropy), full support for
FP16 output into a frame buffer (including any blending operations and even
MSAA). FP16 texture compression, including 3Dc.
New RGBA (10:10:10:2) integer data type in a frame buffer for higher quality
rendering without FP16.
New high-quality algorithm for anisotropic filtering (a user is given a
choice between a faster or higher-quality anisotropy options), improved trilinear
filtering
Support for "double-sided" stencil buffer
MRT (Multiple Render Targets — rendering into several buffers)
2 x 128-bit internal ring bus for memory reads (4 memory channels, programmable
intelligent arbitration logic).
Efficient caching and a new more effective HyperZ implementation
2xRAMDAC 400 MHz
2 x DVI interfaces with HDCP support
TV-Out and TV-In, HDTV-Out
Hardware video processor (for video compression, decompression, and post
processing), new generation that can accelerate operations with H.264 — a
new algorithm for video compression used in HD-DVD and Blu-Ray video discs.
2D accelerator supporting all GDI+ functions
ATI CrossFire support
Zvanična specifikacija ATI Radeon X1300 GPU-a
i prvi predloženi modeli
Codename: RV515
Process technology: 90 nm
105 million transistors
FC package (flip-chip, flipped chip without a metal cap)
128 bit memory interface (optional 64 and 32 bit configurations)
Up to 256 MB of DDR1/2 or GDDR-3 memory
HyperMemory support
PCI Express 16x
4 pixel processors (one quad)
4 texture units
Calculating, blending, and writing up to 4 full (color, depth, stencil
buffer) pixels per clock
3 vertex processors
FP32 processing throughout the pipeline (vertices and pixels)
Full SM 3.0 support (Shader Model 3.0), including dynamic branching in
pixel and vertex processors, texture sampling from vertex processors, etc.
Effective branching
FP16 processing throughout the pipeline: arbitrary filtering for integer
and floating point FP16 textures (including anisotropy), full support for
FP16 output into a frame buffer (including any blending operations and even
MSAA). FP16 texture compression, including 3Dc.
New RGBA (10:10:10:2) integer data type in a frame buffer for higher quality
rendering without FP16.
New high-quality algorithm for anisotropic filtering (a user is given a
choice between a faster or higher-quality anisotropy options), improved trilinear
filtering
Support for "double-sided" stencil buffer
MRT (Multiple Render Targets — rendering into several buffers)
4 x 32-bit crossbar
Efficient caching and a new more effective HyperZ implementation
2xRAMDAC 400 MHz
2 x DVI interfaces with HDCP support
TV-Out and TV-In, HDTV-Out
Hardware video processor (for video compression, decompression, and post
processing), new generation that can accelerate operations with H.264 — a
new algorithm for video compression used in HD-DVD and Blu-Ray video discs.
2D accelerator supporting all GDI+ functions
Kartica na testu – Radeon X1800 XT (Fudo at his best)
ATI Radeon X1800 XT Non-Qualification sample je najjača kartica sa R520 čipom.
Nju karakteriše sličnost sa Radeonom X850 XT PE, ali samo na prvi pogled, jer
je PCB kod nove kartice znatno duži i u milimetar se “poklapa” sa GeForce 7800
GTX karticom. Opremljena je sa dva DVI izlaza i jednim posebnim konektorom
S-Video tipa, koji služi za video in i out povezivanje. Naravno, najjači Radeon
stiže sa Rage Theater čipom. GPU koji ima preko 320 miliona tranzistora “kuca”
na 625 MHz (mada bez intervencije na ASUS i MSI nForce 4 pločama rade na oko
634 MHz, što smo mi ručno rešili), dok je svih 512 MB memorije podešeno na
750 (1500 DDR) MHz.
Za ovako mnogo zahtevnih čipova je neophodno obezbediti veoma moćnu naponsku
jedinicu, koja je, bar po izgledu, slična onoj kod GeForce 7800 GTX kartica
– dodatno je hlađena malim metalnim profilom sa rebrima. Koriste se pretežno
digitalne komponente, pa je na Radeonu X1800 XT, kod naponske jedinice nemoguće
videti elektrolitske kondenzatore (dva se nalaze kod takt generatora).
Ostatak kartice je pokriven veoma velikim dual-slot kulerom, produžene verzije
rashladnog sistema sa Radeona X850 XT PE. PCB je izuzetno kompleksan, a jedan
od razloga je i novi raspored memorijskih čipova koji se nalaze pod uglovima
sa razmacima od po 45 stepeni između svakog para – rešenje koje nVidia koristi
još od FX5900 serije kartica, a koje smo prvi put videli kod Matrox Parhelie
512.
ATI Radeon X1800 XT koristi novu GDDR3 memoriju sa kojom se po prvi put susrećemo.
U pitanju je Samsung sa krajnjom oznakom BJ12, što nam govori da je latencija
smanjena na 1.25 ns, što odgovara frekvenciji od efektivnih 1600 MHz, ali
na samoj kartici su podešeni na 750 (1500 DDR) MHz. Na referentnoj kartici
se nalazi osam 512 Mbitnih čipova, raspoređenih sa osnovne strane štampe.
Na pozadini se nalazi osigurač koji pridržava kuler, odnosno sprečava da
se PCB iskrivi zbog masivnog aluminijumskog profila na osnovnoj strani.
R520 GPU sa naših sempl kartica je proizveden 37. nedelje tekuće godine (septembar),
što znači da je prvog oktobra, kada smo bili na Ibizi, bio svega dve do tri
nedelje “star”.Kuler je, kao što smo pomenuli, veoma sličan onom kod R480 XT
kartica. Sastavljen uglavnom od legure aluminijuma, ispod koje se, na mestima
koja su u dodiru sa memorijskim čipovima i GPU-om, nalaze bakarni delovi. Bakar
efektnije preuzima toplotnu energiju sa GPU-a i prosleđuje je tankim bakarnim
listićima, kroz koje veliki ventilator provlači zagrejan vazduh i izbacuje
ga van kućišta. Aluminijum se lakše oslobađa toplotne energije, pa kombinacija
bakar – aluminijum, može biti bolja od čisto bakarne, ako je konstrukcija celog
elementa odrađena na pravi način.
Ventilator na kartici radi na maksimalnom broju obrtaja samo tokom butovanja,
da bi kasnije usporio i proizvodio gotovo nečujan, mada pomalo plastičan šum.
Radeon X1800 XT radi veoma stabilno i daje oštru sliku i u najvišim rezolucijama.
Maksimum koji smo uspeli da postignemo sa ovom karticom iznosi 695 MHz za jezgro
i 1790 MHz na koliko je maksimalno htela da radi memorija.
Kartica na testu – Radeon X1800 XL
Radeon X1800 XL je takođe Non Qualification Sample, koji koristi isti PCB
layout kao i jači model, ali poseduje drugačiju memoriju, radi na nižim učestanostima
i naponima i ima skromniji ali praktičniji i privlačniji rashladni sistem.
Pošto je štampana ploča ista, nećemo ponavljati rečeno, već ćemo istaći da
X1800 XL stiže sa memorijskim čipovima sa potpisom korejskog giganta Samsung
(BC-14) koji imaju rejting of 1.4ns latencije, što odgovara radnom taktu od
oko 1430 DDR MHz. Osam 256Mbitnih GDDR3 čipova daje lokalni frejm bafer od
256 MB, koji su, kao i GPU, podešeni na 500 MHz ili kako bi neki rekli – sinhrono.
Memorijski čipovi su smešteni sa osnovne strane PCB-a, ispod single-slot kulera,
dok sa druge strane nije ni predviđeno mesto za postavljanje memorije. Radeon
X1800 XL koristi GPU iz prethodnog tape-out- a, tačnije iz 33 nedelje
tekuće godine, koji ne može da se klokuje mnogo više od 550 MHz.
Rashladni sistem, iako tanak, dobro radi svoj posao, a tome najviše doprinose
dve toplotne cevi u obliku slova U, koje ravnomerno raspoređuju toplotu u svaki
kraj kulera, kroz koji ventilator provlači, odnosno uvlači vazduh. Listići
unutar kućišta profila su napravljeni od aluminijuma, ali se za ceo kuler može
reći da je kvalitetno i pedantno izrađen. Nažalost, on je nešto bučniji od
onog kod Radeon X1800 XT modela, ali se ni XL ne može nazvati bučnom karticom.
Kao i prethodno opisani model, Radeon X1800 XL, preko svoja dva DVI
izlaza daje oštru sliku i u najvišim rezolucijama i nije pokazao znake nestabilnosti
u radu.
Kartica na testu – Radeon X1600 XT
Radeon X1600 XT, još jedan Non Qualification sempl koji smo doneli sa R5xx
“world tour-a”, je po dimenzijama znatno manja kartica čiji PCB može da se
poredi sa onim korištenim za Radeon X700 Pro modele.
Kao što smo mogli da predpostavimo, naponska jedinica je dosta jednostavnija
od one kod najjačih modela, a na kartici nema ni šestopinskog konektora za
eksterno napajanje. Najveći deo naponske jedinice, sastavljene od oklopljenih
elektrolitskih kondenzatora, navoja / prigušnica i naponskih regulatora,
smešten je u gornjem desnom uglu, a neke od komponenti su zarotirane za 45
stepeni. Primećujemo i mesto za Rage Theater čip, koji na referentnom modelu
nedostaje (vendori mogu da ga dodaju na specijalna izdanja X1600 kartica),
ali i mesto za dodatni TMDS transmiter, kao i na jačim modelima.
Memorijski čipovi su i ovoga puta smešteni sa osnovne strane PCB-a, ali ne
“u krug” već iznad i levo od GPU-a, kao kod starijih Radeon kartica. Iznenadili
smo se kad smo videli da su u pitanju Samsung BJ12 čipovi, koji imaju latenciju
od svega 1.2ns, ali svakako rade na nešto nižem naponu pa ne mogu dostići
frekvencije kao kod Radeona X1800 XT. Zapravo, biće pravo iznenađenje ako
i vendori budu upotrebljavali iste skupe memorijske čipove. Verujemo da ih
je ATI postavio zbog bolje kompatibilnosti sa RV530 GPU-om koji ima istu
RingBus magistralu kao i R520. Ovo je moguće zbog toga što je RV530 na sempl
karticama još uvek u engineering sample fazi, što znači da će novije
verzije verovatno imati i bolji overkloking potencijal. No, o tome nećemo
spekulisati – sigurni smo da će kartice iz MSI-ja, ASUS-a i drugih vendora
stizati sa jeftinijim čipovima.
Na kartici sa testa se nalaze četiri 512 Mbit čipa, što čini ukupno 256 MB
memorije, koje iako sposobne da rade na 1600 DDR MHz, na Radeon X1600 XT
kartici rade na 1380 MHz. Jezgro je podešeno na sjajnih 590 MHz i kartica
se u toku rada i intenzivnog testiranja ne greje previše.
Rashladni sistem na Radeonu X1600 XT i nije toliko jednostavan kao što na
prvi pogled izgleda. Zapravo, kuler je solidne veličine, a sastavljen je
od bakarnih listića koji su spojeni i odozdo ojačani limom, dok su sa gornje
strane spakovani u plastično kućište. Iako se kartica ne greje previše, ventilator
ume da bude glasniji nego što bi trebalo, mada je ipak tiši od onog na referentnim
Radeon X700 Pro karticama. I ova kartica je pokazala maksimalnu stabilnost
u radu, nemamo nikakvih zamerki po tom pitanju.
Kartica na testu – Radeon X1300 Pro
Jedini akcelerator sa Pro sufiksom na ovom testu, ujedno je i najslabiji i
poslednji o kome pišemo pre nego što krenemo na rezultate. Na prvi pogled,
rekli bi ste da su Radeon X1600 XT i X1300 Pro iste kartice, ali već nakon
par sekundi, prve razlike mogu da se uoče. Prvo, Radeon X1300 Pro poseduje
jedan DVI konektor, dok je na sekundarnoj poziciji D-Sub analogni priključak.
Upravo zato i ne možemo primetiti mesto za sekundarni TMDS transmiter.
Naponska jedinica je dodatno pojednostavljena, a možemo primetiti i drugačije
vodove do memorijskih čipova. Ovi čipovi su GDDR2 tipa, Infineon ih proizvodi
i imaju rating od 2.5 ns, a smešteni su sa obe strane štampe. Ova latencija
odgovara radnim učestanostima od 800 DDR MHz, na koliko je ona i podešena na
Radeon X1300 Pro modelu. GPU je standardno podešen na 600 MHz, a hladi ga identičan
rashladni sistem kao onaj koji smo već opisali kod Radeona X1600 XT.
Test Setup
PCI Express kartice smo testirali na test sistemu
prikazanom u tabeli:
Procesor
AMD Athlon 64 3500+ @ 2600 MHz (260 x 10)
Matična ploča
MSI K8N Platinum SLI
nVidia nForce 4 SLI
HTT 4 x 260 MHz
Memorija
2 x 512 MB Corsair TwinX PC4400CL25 (Samsung TCCD)
@ 260 MHz (2.5-4-4-8-1T)
Hard Disk
Western Digital Caviar 200 GB ATA133 (2000JB)
Video Karte
ATI Radeon X850 XT Platinum
Edition – 256 MB GDDR3 – Catalyst 5.9
MSI NX7800 GTX VIVO – 256 MB GDDR3 – ForceWare 77.77
MSI NX7800 GT VIVO – 256 MB GDDR3 – ForceWare 77.77
Gigabyte GeForce 6800 Ultra – 256 MB GDDR3 – ForceWare 77.77
ASUS GeForce 6600 GT
– 128 MB GDDR3 – ForceWare 77.77
Club3D GeForce 6800 -128 MB DDR – ForceWare 77.77
Sapphire Radeon X800 XL
– 256 MB GDDR3 – Catalyst 5.9
ATI Radeon X700 Pro – 256 MB GDDR3 – Catalyst 5.8
ATI Radeon X1800 XT – 512 MB GDDR3 – Catalyst 5.10 beta
ATI Radeon X1800 XL – 256 MB GDDR3 – Catalyst 5.10 beta
ATI Radeon X1600 XT – 256 MB GDDR3 – Catalyst 5.10 beta
ATI Radeon X1300 Pro – 256 MB DDR2 – Catalyst 5.10 beta
Monitor
Samsung SyncMaster 959NF
Cooling
CoolerMaster Hyper 6
DVD uređaj
Pioneer DVR-108D
CDRW uređaj
Pioneer DVR-106S
Operativni sistem
Windows XP Service Pack 2 with
XPLite! (optimized for performance)
Direct X 9.0c
Igre/Bench programi
FutureMark 3D Mark 03 340
FutureMark 3D Mark 2005
iD Software Doom 3
Microsoft Halo for PC
Aquamark 3 Commercial Plus
Activision Call of Duty: United Offensive
Valve’s Counter Strike: Source
Valve’s Half Life 2
Splinter Cell: Chaos Theory
Crytek FarCry v1.33
ColinMcRae 4
CodeCreatures Benchmark Demo
SpecORG ViewSPEC Perf 8.1
X2 – The Threat Rolling Demo Benchmark
Painkiller retail
Prince of Persia: Sands of Time Retail
The Chronicles of Riddick Retail
Battlefield 2
F.E.A.R Demo
Kako smo testirali ?
Radeon kartice smo testirali sa default opcijama. Trilinearne optimizacije
su ostale uključene, a anisotropic isključene. Geometric Instancing je uključen
pomoću ATI Tray Tools softvera kod starijih ATI kartica. Pokušali smo da utvrdimo
da li sa sadašnjim najzahtevnijim igrama možemo da simuliramo situaciju u kojoj
će se grafički akceleratori naći u radu sa igrama sledeće generacije. Zbog toga
smo neke od naslova, pored standardnih modova, pokrenuli i uz primenjeni anisotropic
filtering (16x) i četvorostruki full-screen antialiasing, pa nema standardnog
dela testa "zahtevni modovi" pošto
su AF + AA tabele date na standardnim stranama. nVidia kartice smo testirali
na Quality setovanjima.
Sintetički benchmark programi ~ 3DMark 03 – #340
3DMark benchmark program iz 2003. godine, iako kritikovan od strane mnogih,
pokazao je i da proizvodjači moraju voditi računa o brzini izvršavanja Shader
programa, te da je veoma zdravo ispoštovati do kraja DirectX 9 specifikaciju,
odnosno napisati sopstveni kompajler da što bolje sarađuje sa HLSL prevodiocem
Microsoftovog API-ja. 3DMark03 je patch-ovan najnovijom zakrpom, a testirali
smo na default setovanjima.
Poznato je da 3DMark03 ume lepo da izmeri samu moć grafičkog
podsistema, a razlike u igrama nikada nisu toliko velike, no ipak nam se dopada
što je novi Radeon X1800XT pokazao toliku prednost u odnosu na ostale
kartice.
3DMark05
Novo izdanje 3Dmark benchmarka može da se izvršava samo sa Direct X 9 kompatibilnim
akceleratorima. Sva tri testa koriste Shader Model verzije 2.0, 2.0a, 2.0b ili
3.0 – u zavisnosti od podrške koju GPU ima (Radeon 9700 do X800 modela podržavaju
SM 2.0 i 2.0b, dok nVidia FX akceleratori podržavaju verziju 2.0 i 2.0a, a GeForce
7800GTX, kao i GF serije 6, podržava SM 2.0, 2.0a i 3.0). Sva tri game demoa
su izuzetno zahtevni, karakteriše ih jezivo visok broj poligona koji opterećuje
VS jedinicu, kompleksni shader programi (mapiranje neravnina, osvetljenja, emulacija
HDR, particle efekti, dinamične i meke senke, subface scattering, napredni fog
efekti (emulacija volumetric efekta), ali i dosta postprocesing efekata. Najjače
kartice danas isporučuju od 15 do 20 frejmova u većini scena, a na najzahtevnijim
delovima i manje!
Ponovo vidimo izrazitu prednost ATI-jevog novog akceleratora, koji superbrzo
izvršava shader programe, ali i radi na izrazito visokim učestanostima…
AquaMark Commercial Plus
Ovaj benchmark program karakterističan jepo velikom broju opcija za testiranje
mogućnosti Direct X 7, 8 i 9 kompatibilnih video kartica. Koristili smo maksimalan
nivo detalja, test se izvršava bez zvuka, a anisotropic i antialiasing filteri
su bili isključeni. Nismo dali ukupan rezultat već prosečan frame rate po rezoluciji.
Kao što vidimo u ovom testu, razlike između GeForce 7800 GTX i Radeon
X1800 XT akceleratora nisu preterano velike, ali je opet vidljiva prednost novog
X1800 XT modela.
CodeCult Codecreatures Standard Benchmark
I dalje vrlo lep i zahtevan benchmark program koji koristimo je CodeCreatures.
Baziran je na engine-u koji koristi Shadere verzije 1.3 (Direct X 8), i odlično
ukazuje na to kako se kartica snalazi sa teksturama veoma visoke rezolucije i
velikom količinom poligona. Vizuelna atraktivnost i fotorealističnost su i po
današnjim standardima na visokom nivou, ali je igra Far Cry definitivno za klasu
nadmašila ovaj test, barem u vizuelnom aspektu. Default test se izvršava u tri
rezolucije: 1024×768, 1280×1024 i 1600×1200. Moguće je kreirati batch u kome
je ćete izabrati sopstvene modove od rezolucija 640*480 do najvišeg grafičkog
moda koji kartica podržava.
Iako napravljen pre više od dve godine, ovaj zahtevni test možda najbolje
pokazuje realno stanje stvari između G70 GTX i R520 XT akceleratora – bar
kada je Direct3D u pitanju.
SpecORG SpecView Perf 8.1
Mi smo koristili smo poslednju aktuelnu verziju koji se sastoji od čak osam celina.
SpecviewPerf meri performanse sistema pod OpenGL API-jem tako što simulira osam
standardnih industrijskih aplikacija. 3Dsmax-03 je bayiran na SPECapc za 3dS
MAX u OpenGL okruženju. U sceni su tri modela sastavljena od po približno 1.5
miliona vertices-a, a testiranje se vrši uz nekoliko tipičnih tipova osvetljenja.
Catia-01 je bazirana na Dassault CATIA inžinjering aplikaciji u kojoj modeli
imaju do dva miliona osnovnih linija. Ensight-01 je simulacija CEI EnSight inžinjering
aplikacije koja se koristi za vizuelizaciju. U test su ubačeni displej-list i
fast preview modovi rada. Light-07 je baziran na Discreet-ovoj Lightscape aplikaciji
koja koristi realtime radiosity senčenje. Maya-01, kako joj i samo ime govori,
simulira radno okruženje paketa kompanije Alias – Maya 5, nezamenljivi alat filmadžija
u Holivudu. Proe-03 je baziran na SPECapc okruženju za Pro-Engineer 2001, koji
u sceni primenjuje dva modela u tri shade moda (senčeni, wireframe i hidden-line
removal). SW-01 simulira Solidworks 2004 aplikaciju, koju izdaje Dassault Systems
i konačno, test Ugs-04, baziran na SPECapc Unigraphics V17 aplikaciji (odnosno
simulaciji iste), u kojem je prikazan model motora sastavljen od preko četiri
miliona osnovnih linija.
nVidia i dalje predstavlja bolji izbor ako radite u CAD i CAM aplikacijama –
simulacije odredjenih softverskih paketa su u ovim situacijama donekle i reprezentativne.
Real Gaming testovi / OpenGL ~ Call of Duty United Offensive
Call of Duty je odlična single i multiplayer igra, bazirana na žestoko modifikovanom
Quake III engine-u, a United Offensive donosi i niz dodataka kada je grafika
u pitanju, pa je tako i zahtevnija. I ovoga puta, podešavanja su bila na apsolutnom
maksimumu.
Doom 3
Doom 3 testiramo sa ugrađenim Demo1 demo-om, na high podešavanjima (highest je
predviđen za kartice sa 512 MB memorije), što podrazumeva da je zvuk isključen,
svi detalji na maksimumu (sve senke, poligoni i najveće teksture), ali i da je
uključeno osmostruko anizotropno filtriranje. Dodat je i UltraHighQuality.pk4,
koji omogućava da objekti bacaju senku sami na sebe (tzv. self-shadow). Zvuk,
AI i fizika su isključeni automatski, samim pokretanjem timedemo komande.
nVidia u Doom-u "baca" neverovatno visoke rezultate, pogotovo ako znamo
da je u ovako detaljnom 3D okruženju primenjen i 8x AF filter.
U još zahtevnijem modu, takođe nema nikakvih iznenađenja!
The Chronicles of Riddick
I jedna bonus igra, veliki hit, koji stiže uz veliki broj high end i mainstream
MSI video kartica. Bazirana je na OpenGL API-ju, a koristili smo najviša setovanja
(PS3.0 na GeForce karticama), dostupna iz same igre.
nVidia i dalje daleko bolja u primenjenom OpenGL okruženju – na G70 se u ovoj
igri možete igrati i u 2048 x 1536 sa 16x anisotropic
filterom… uz odličan frame rate. Sa ATI-jem, najverovatnije, ne bi ste
mogli.
Splinter Cell Chaos Theory
Ova igra koristi najnoviju dostupnu verziju Unreal engine-a (tzv. U2.5) i u
mnogo većoj meri se oslanja na upotrebu shadera. Karakteriše je veliki broj
poligona, ali i funkcije kao što su HDR, paralax mapping, klasican bump mapping
i veliki broj normal tekstura (tu su i stancil efekti, dosta post processing
filtera itd.). Testirali smo na najvišim mogućim setovanjima, kao i uvek. HDR
je, za razliku od SM3.0 moda na GeForce karticama bio iskljucen.
U SM3.0 modu Radeon X1800 XT pokazuje koliko može, što je i logično,
kada znamo da je Splinter Cell 3 veoma shader-intenzivna i za GPU veoma
zahtevna igra.
Colin McRae 04
Naš testbed je svakako zaslužio da mu se pridruži i jedna popularna simulacija
reli vožnje. Ubedljivo najpopularnija i na ovim prostorima, jeste četvrta
inkarnacija Colin McRae relija. Iako nije napredovala od prethodne, barem u čisto
tehničkom aspektu, ova odlična igra je reprezentativan primer svog žanra, pa
će mnoge zanimati kako se ponašaju novi video akceleratori u jednom ovakvom naslovu.
I ovoga puta smo, kao bonus br. 2 ubacili igru Painkiller: Battle Out
of Hell, sada samo u anisotropic + antialiasing modu, jer je u drugom
slučaju igra previše limitirana brzinom CPU-a.
X2 – The Threat
X2 – The Threat je igra koja je u trenutku kada je izašla, privukla pažnju
raskošnom grafikom, karakteristična po detaljnim teksturama, svetlosnim efektima
i particle efektima. Koristi Direct X 8.1, iako inicijalno zahteva instaliranje
verzije 9.0. Za testiranje nismo koristili retail verziju već rolling benchmark
demo, mada i prava verzija ima benchmark mod. Grafika je bila podešena na maksimum,
a zvuk isključen. Uskoro se očekuje nastavak – X3 – The Reunion.
GeForce 7800GTX pokazuje preko 30% ubrzanja u najvišoj rezoluciji, i to u modu
bez AA i AF filtera. Veoma lepo!
Prince of Persia: Sands of Time
Igra koja je pre godinu dana oduševila gaming community širom sveta: inventivan
gameplay, potezi, jako simpatična Direct X 9 grafika sa skalabilnim engine-om,
sposobnim da radi i u Direct X 8.1, 8.0 i 7.0 modu. Tokom testiranja smo se služili
sa aplikacijom Fraps.
Ovoga puta smo kao glavni bonus, dodali igru veliku multiplejer hit igru – Battlefield
2. Standardno, kartice smo “mučili” na najvišim
detaljima, a tu su i AF+AA modovi…
Još jedna od igara u kojoj ATI R520 zaista blista…
Halo: Combat Evolved
Igra zbog koje su mnogi pre tri godine kupili X-Box konzolu, fenomenalni Halo
u verziji za PC je optimizovan za Direct X 9 kartice. Program koristi Pixel
Shadere verzije 2.0. Ovi programi se mogu izvršavati i preko starijih verzija
Pixel Shadera, ali smo mi koristili DX9 mod, najveći broj detalja i trilinearni
mod filtriranja.
Far Cry v1.33
Igra koja je po mnogima redefinisala žanr, odnosno pooštrila kriterijume kada
su vizuelni aspekt, ali i gameplay u pitanju. CryTek-ov engine je demonstracija
mogućnosti Direct X 9 API-ja u praksi – tu je ogroman broj poligona i efekata
koji se izvršavaju u Shader jedinicama, celih 128 MB video memorije je po nivou
rezervisano i zajedno sve izgleda jednostavno fenomenalno. Fotorealistična grafika
i do sada najbolja fizika i dizajn nivoa su atributi ove fenomenalne igre. Tu
su i shaderi za Normal mapping, napredne enviroinment fizike, promenljiva geometrija
terena, dinamičke senke i osvetljenja, motion capture animacije… Testirali smo
sa Very high i Ultra high podešavanjima (gde je moguće), uz
pomoć već snimljenog i opšte prihvaćenog demoa. GeForce 6 i 7 serija kartica
koristi Shader Model 3.0, ali smo HDR, naravno, iskljucili kako bi poredjenje
sa konkurentom bilo fer.
U modu bez anisotropic-a i antialiasing filtera, igra je CPU limited, ali se u eye-candy modu lepo vidi koliko potencijala u shader-intenzivnim igrama ima R520 XT. AA i AF su, podsetimo, aktivirani u High Quality modu.
CS: Source Video Stress test
Novi Counter Strike je stigao. Umesto da kreiramo demoe na postojeći mapama,
nas je pre zanimalo kako će osnovni efekti u Source Engine-u raditi na novim
karticama, pa smo pokrenuli Video Stress test koji se nalazi u glavnom meniju,
uz najviša moguća setovanja u video sekciji.
Half Life 2
Sta reći o igri koja je čekana čitavih pet godina i prema mnogim mišljenjima
i prevazišla najviša moguća očekivanja. Engine nije toliko napredan kao onaj
kod igre FarCry ili čak Doom 3, ali je moćan, fleksibilan (skalabilan) i odlično
optimizovan, te svakako pokazuje kakve će performanse kartice dati u igrama koje
očekujemo. Testirali smo sa najvišim kvalitetom (highest), samo su Anisotropic
i Antialiasing bili isključeni.
F.E.A.R MP Demo
Ova fantastična, grafički impresivna i veoma zahtevna igra
je dobila zasluženo
mesto u našem
test batch-u. Uskoro izlazi finalna verzija, pa ćemo još detaljnije
moći da se pozabavimo testiranjem kroz nju. Kao i uvek, sve opcije smo stavili
na maksimum.
Na kraju, odlučili smo da vidimo koliki performance impact ima Adaptive
AA i uporedimo ga sa Transparency AA kod nVidia GeForce 7800 GTX kartica pod
najsličnijim mogućim uslovima.
Kao što možemo videti, ATI Radeon X1800 XT mnogo brže obrađuje
transparentne teksture nego konkurentski GeForce 7800 GTX.
Takođe, možete videti i koliko ubrzanje postiže ATI Radeon
X1800 XT kada se dodatno overklokuje:
Performanse Radeon X1600 XT i Radeon X1300 Pro akceleratora:
3DMark05
Novo izdanje 3Dmark benchmarka može da se izvršava samo sa Direct X 9 kompatibilnim
akceleratorima. Sva tri testa koriste Shader Model verzije 2.0, 2.0a, 2.0b ili
3.0 – u zavisnosti od podrške koju GPU ima (Radeon 9700 do X800 modela podržavaju
SM 2.0 i 2.0b, dok nVidia FX akceleratori podržavaju verziju 2.0 i 2.0a, a GeForce
7800GTX, kao i GF serije 6, podržava SM 2.0, 2.0a i 3.0). Sva tri game demoa
su izuzetno zahtevni, karakteriše ih jezivo visok broj poligona koji opterećuje
VS jedinicu, kompleksni shader programi (mapiranje neravnina, osvetljenja, emulacija
HDR, particle efekti, dinamične i meke senke, subface scattering, napredni fog
efekti (emulacija volumetric efekta), ali i dosta postprocesing efekata. Najjače
kartice danas isporučuju od 15 do 20 frejmova u većini scena, a na najzahtevnijim
delovima i manje!
AquaMark Commercial Plus
Ovaj benchmark program karakterističan jepo velikom broju opcija za testiranje
mogućnosti Direct X 7, 8 i 9 kompatibilnih video kartica. Koristili smo maksimalan
nivo detalja, test se izvršava bez zvuka, a anisotropic i antialiasing filteri
su bili isključeni. Nismo dali ukupan rezultat već prosečan frame rate po rezoluciji.
Doom 3
Doom 3 testiramo sa ugrađenim Demo1 demo-om, na high podešavanjima (highest je
predviđen za kartice sa 512 MB memorije), što podrazumeva da je zvuk isključen,
svi detalji na maksimumu (sve senke, poligoni i najveće teksture), ali i da je
uključeno osmostruko anizotropno filtriranje. Dodat je i UltraHighQuality.pk4,
koji omogućava da objekti bacaju senku sami na sebe (tzv. self-shadow). Zvuk,
AI i fizika su isključeni automatski, samim pokretanjem timedemo komande.
The Chronicles of Riddick
I jedna bonus igra, veliki hit, koji stiže uz veliki broj high end i mainstream
MSI video kartica. Bazirana je na OpenGL API-ju, a koristili smo najviša setovanja
(PS3.0 na GeForce karticama), dostupna iz same igre.
Splinter Cell Chaos Theory
Ova igra koristi najnoviju dostupnu verziju Unreal engine-a (tzv. U2.5) i u
mnogo većoj meri se oslanja na upotrebu shadera. Karakteriše je veliki broj
poligona, ali i funkcije kao što su HDR, paralax mapping, klasican bump mapping
i veliki broj normal tekstura (tu su i stancil efekti, dosta post processing
filtera itd.). Testirali smo na najvišim mogućim setovanjima, kao i uvek. HDR
je, za razliku od SM3.0 moda na GeForce karticama bio iskljucen.
Painkiller: Battle Out
of Hell, ovoga puta samo u anisotropic + antialiasing modu, jer
je u drugom slučaju igra previše limitirana brzinom CPU-a (čak
i na mainstream karticama) .
Ovoga puta smo kao glavni bonus, dodali igru veliku multiplejer hit igru
– Battlefield
2. Standardno, kartice smo "mučili" na najvišim
detaljima…
Halo: Combat Evolved
Igra zbog koje su mnogi pre tri godine kupili X-Box konzolu, fenomenalni Halo
u verziji za PC je optimizovan za Direct X 9 kartice. Program koristi Pixel
Shadere verzije 2.0. Ovi programi se mogu izvršavati i preko starijih verzija
Pixel Shadera, ali smo mi koristili DX9 mod, najveći broj detalja i trilinearni
mod filtriranja.
Far Cry v1.33
Igra koja je po mnogima redefinisala žanr, odnosno pooštrila kriterijume kada
su vizuelni aspekt, ali i gameplay u pitanju. CryTek-ov engine je demonstracija
mogućnosti Direct X 9 API-ja u praksi – tu je ogroman broj poligona i efekata
koji se izvršavaju u Shader jedinicama, celih 128 MB video memorije je po nivou
rezervisano i zajedno sve izgleda jednostavno fenomenalno. Fotorealistična grafika
i do sada najbolja fizika i dizajn nivoa su atributi ove fenomenalne igre. Tu
su i shaderi za Normal mapping, napredne enviroinment fizike, promenljiva geometrija
terena, dinamičke senke i osvetljenja, motion capture animacije… Testirali smo
sa Very high i Ultra high podešavanjima (gde je moguće), uz
pomoć već snimljenog i opšte prihvaćenog demoa. GeForce 6 i 7 serija kartica
koristi Shader Model 3.0, ali smo HDR, naravno, iskljucili kako bi poredjenje
sa konkurentom bilo fer.
Half Life 2
Sta reći o igri koja je čekana čitavih pet godina i prema mnogim mišljenjima
i prevazišla najviša moguća očekivanja. Engine nije toliko napredan kao onaj
kod igre FarCry ili čak Doom 3, ali je moćan, fleksibilan (skalabilan) i odlično
optimizovan, te svakako pokazuje kakve će performanse kartice dati u igrama koje
očekujemo. Testirali smo sa najvišim kvalitetom (highest), samo su Anisotropic
i Antialiasing bili isključeni.
Zaključak
Posle verovatno najviše provedenog vremena posvećenog izučavanju i testiranju
jedne tehnologije, kao i jednog od najdužih testova na Benchmarku uopšte, ne
možemo biti preterano sažeti i lako dati prost i kratak odgovor – da li je
Radeon X1800 XT ispunio očekivanja, kako bi bilo da se pojavio na vreme, koliko
je Radeon X1600 konkurentan, a koliko će verovatno biti konkurentan narednih
meseci? Gde je u celoj priči Radeon X1300?
ATI je bio lider u vreme kada je DirectX 9 bio najnovija verzija ovog sveprisutnog
programerskog okruženja, a onda su čekali pogodan trenutak za novu generaciju.
R520 je napravljen sa aktuelnim trendovima na umu, pa ponekad ne može da pokaže
koliko je moćan jer dobar deo igara vuče “nasleđe” od pre 12, 24 ili 36 meseci.
Da bi u GPU spakovali sve što je neophodno, insistirano je na 90-nm procesu,
kako kartica ne bi bila preglomazna i prezahtevna po pitanju potrošnje. Zbog
veoma napredne arhitekture, bag koji je sprečavao visoke radne frekvencije,
zadavao je noćne more timu inženjera dug niz meseci, a onda su uspeli da ga
izoluju i problem reše u roku od nekoliko časova.
Radeon X1800 XT i XL su se pokazali odlično u mnogim testovima, dok su u nekima
bili sporiji nego što smo mogli da predpostavimo. Primetili smo i mnoge sitnice
koje su vezane za same drajvere – Radeon X850 XT PE je ponekad brži i kada
to nikako nije logično, a performanse su nekad u modu 1280 x 1024 više od onih
u 1024 x 768, što znači da će vremenom i nove revizije drajvera malo promeniti
stanje stvari. Kod nVidie se to već dogodilo sa ForceWare Serijom 80, mada
nismo imali vremena da proverimo porast performansi kod GeForce 7800 GTX kartica
sa novom revizijom drajvera. Dopala nam se činjenica da R520, zahvaljujući
fantastično optimizovanom memorijskom kontroleru i boljoj podeli posla u okviru Shader jezgra,
značajno brže radi antialiasing transparentnih tekstura – AdaptiveAA zadaje
manji udarac na performanse X1800 kartica nego nVidia Transparency AA na G70
bazirane modele.
Ne možemo reći da je Radeon X1800 XT moćnija kartica od GeForce 7800 GTX-a,
ali smo sigurni da donosi pametnije osmišljenu i dizajniranu arhitekturu, kao
i da predstavlja dobru osnovu za Radeon X1900 XT (nezvanični naziv R580 bazirane
kartice), koji ATI već ima kao sempl karticu. Novi high-end Radeon je pokazao
zube u modernim D3D naslovima kakvi su Battlefield 2, FEAR, Splinter Cell 3
– u nekim igrama je rame uz rame sa direktnim konkurentom, a u OpenGL igrama,
kakve su Chronicles of Riddick ili Doom III, npr. solidno zaostaje. Ovo se
ubrzo može promeniti, ako Catalyst tim isporuči obećano – potpuno rekompajliranu
OpenGL biblioteku. U očigledne prednosti R520 XT i XL kartica spada i veoma
brzo izvršavanje Shader Model 2.0 testova (u okviru sintetičkih programa i
u okviru igara), ali i najkompletnija implementacija Shader Modela verzije
3.0. X1000 serija kartica podržava i FSAA kada je uključen HDR, pa je sada
prednost u kvalitetu slike u igrama kakve su FarCry 1.3x, BattleField 2, Splinter
Cell 3 ili Half Life 2 Lost Coast na strani Radeon-a. Igre F.E.A.R, Call of
Duty 2, Serious Sam 2, Quake IV i Elder Scrolls Oblivion podržavaju HDR, pa
jedva čekamo da vidimo kako će se ATI pokazati u njima. Jedno je sigurno, novi
OpenGL drajver mora biti spreman do premijere igre Prey, koja je bazirana na
Doom 3 engine-u, a iza koje stoji ATI. Takođe, X1800 XT je spreman za još zahtevnije
i kompleksnije igre jer stiže sa 512 MB VRAM-a. Prednost novog GPU-a kanadske
kompanije leži i u činjenice da se sada pipeline još intenzivnije koristi za
hardverski dekoding video sadržaja, sa posebnim akcentom na video visoke definicije,
bez obzira na kodek (novost je hardverska podrška za dekodiranje H.264 videa),
kao i Avivo multimedijalna komponenta, kao sastavni deo novih Radeon kartica.
Sa druge strane, Radeon X1800 XT je zahtevan po pitanju potrošnje energije,
zauzima susedni slot i greje se u radu, iako ne možemo reći da mu je ventilator
na rashladnom sistemu bučan. U svojoj, nešto nižoj klasi, možemo reći da isto
važi i za Radeon X1800 XL, međutim, njegova konkurencija u vidu GeForce 7800
GT-a je nešto žešća u određenim OpenGL i specifičnim Direct3D naslovima. X1800
XL i dalje nudi dobre performanse u FSAA + AF modovima, a takođe je vrlo upotrebljiv
i u kombinaciji ovih filtera sa HDR-om. XL kartica “vuče” dosta manje struje,
pre svega zahvaljujući nižim radnim učestanostima – 1 GHz 256 MB memorije je
manje zahtevno od 512 MB memorije na 1.5 GHz, pa je i jasno zbog čega X1800
XT zahteva napajanje od bar 430W, dok će X1800 XL lepo raditi i sa napajanjem
od skromnijih 350W (u oba slučaja uzimamo Enermax kao referencu).
Mainstream model, Radeon X1600 XT, kao najjače RV530 izdanje je kartica od
koje smo sa pravom najviše očekivali, ali smo najmanje dobili. U najboljim
situacijama (opet se pozivamo na moderne Direct3D aplikacije), X1600 XT će
ponuditi performanse koje su u rangu sa GeForce 6800 modelima, ali će u ostalim
situacijama često biti sporiji od GeForce 6600 GT-a (ali i Radeon X800 GTO,
X800 GT). nVidia-in bestseller ume često da bude i brži od Radeona X1600 XT,
pa bi još jednom istakli koliko je važno da ATI ponudi što bolje drajvere u
najskorijoj budućnosti, kako bi jedna od mana RV530 GPU-a, mali broj TMU jedinica,
bio nadoknađen i kompenzovan njegovim prednostima.
Radeon X1300 Pro je pružio
za nijansu više od onog što smo očekivali od kartice sa takvom specifikacijom;
performanse su definitivno više od bilo koje GeForce 6200 kartice, blizu standardnog
GeForce 6600 modela. Najveći problem je, ponovo, u dostupnosti ovih kartica
u prodaji – Radeon X1800 XL i X1300 Pro se već nalaze na tržištu i kartice
od nekoliko vendora su nam poslate na test. Ostaje pitanje kolika će količina
biti dostupna, (pre svega Radeon X1800 XT modela), kada će i koliko padati
cene ovih akceleratora i koliko će vendora izbaciti mainstream model pre kraja
poslednjeg kvartala.
Ne treba posebno pominjati da je najveća prednost nVidia GeForce Direct X
9.0c kartica u tome što se već neko vreme prodaju na tržištu. Američki dizajner
video procesora ne mora mnogo da žuri sa 7600 i 7200 GPU-ovima, jer se i postojeći
GeForce 6 proizvodi prodaju veoma dobro. Radeon X1800 XT i XL karticama će
biti vrlo teško da se nametnu na tržištu zbog odličnih cena koje imaju GeForce
7800 GTX i GT modeli na samom tržištu. Dodatno, svaki od njih se može dobrano
ubrzati, a njihove performanse adekvatno povećati, što ATI-ju nikako ne odgovara,
pogotovo modelu XL, koji se nije pokazao kao dobar overkloker, bar ne sa sadašnjom
revizijom R520 čipova. U narednom testu ćemo obratiti pažnju na performanse
koje budemo dobili sa novim drajverima i u novim igrama – sasvim je moguće
da će stvari biti dovoljno drugačije da bi smo mogli da revidiramo naš zaključak.
Zahvaljujemo se kompaniji ATI
Technologies na ustupljenom
hardveru za potrebe testa, kao i svoj podršci koja je bila potrebna za
stvaranje ovog teksta.