Uvod
Verovali ili ne, najteže je napisati uvodnu reč. Ako želimo da se postavimo u
kožu čitalaca, na pamet nam padnu i oni koji na kratku priču o tome šta se zbivalo
od kako se pojavio prvi GeForce ili prvi akcelerator koji je radio sa FP brojevima,
gledaju kao na malu uvredu – ako prate Benchmark, naravno da im je sve to već
poznato. Tu su i mladi čitaoci, ili oni koji od nedavno prate ovu granu IT industrije.
Ni njima ne možemo pokazati test ELSA GeForce 256 kartice i reći im da pročitaju
narednih pedesetak… Ne želimo ni da se pravdamo, uvodnik bi, pored eventualnog
pogleda unazad, trebalo da sadrži i deo impresije novim hardverom, preliminarni
deo koji polako priprema čitaoca na cifre od blizu 13000 poena u (ne)popularnom
testu iz 2003. godine. Uvodni tekst koji pokazuje da se povratak kralja ne dešava
samo u Tolkinovim knjigama, za referentnu tačku može uzeti četvrti maj tekuće
godine, kada je istekao NDA za R420 bazirane akceleratore. Kao mnogi već znaju,
prve GeForce 6800 testove smo mogli da čitamo i mesec dana ranije. Mnogi su sa
nevericom posmatrali cifre koje pokazuju dvostruko više rezultate nove kartice,
u odnosu na najjačeg predstavnika prethodne generacije (u Futuremarkovom testu).
A onda je predstavljen X800 XT, koji je, takođe, ispunio sva očekivanja, ali i
pokazao da R420, osim 3Dc kompresije (normal mapa), ne donosi mnogo toga novog.
Nasuprot tome, nV40 je zaista novi, drugačiji i svakako daleko moćniji GPU od
bilo kog čipa iz Cine FX 2.0 familije. nVidia je imala još jedan kec u rukavu
– ForceWare drajveri serije 61 su doneli ogromnu brzinsku prednost u odnosu na
najpopularnije verzije serija 56 i 60, i to ne samo u 3D ili AquaMarku, već i
u ogromnom broju igara (UT2004, FarCry 1.1, Call of Duty i mnoge druge), što ukazuje
na dosledne optimizacije. Drajveri su ostali stabilni, kompaktni, a panelu je
dodat određen broj novih opcija, tako da je potpuno nepotrebno koristiti programčiće
tipa RivaTuner ili GTU. Najvažnija je mogućnost da se optimizacije trilinearnog
filtriranja isključe, ali nVidia tvrdi da je razliku nemoguće primetiti tokom
igranja. U našem iskustvu, razlika u performansama se kreće od 2% u Shader intenzivnim
naslovima, do čak 12% u visokim rezolucijama i starijim igrama koje koriste klasično
multiteksturisanje i tzv. fiksne funkcije (Jedi Knight, MOHAA, Call of Duty),
dok je razlika uočljiva jedino kada se uključi mod koji različitim nivoima osnovnim
bojama obeležava mip nivoe. nVidia tvrdi da i ATI koristi ove optimizacije i u
High Quality modu, a da drajver poseduje detekciju mipmap coloringa (ovakav test
postoji u Serious Sam-u ili 3DMark programu), te tada sam isključuje optimizaciju.
Takođe, novi drajveri (prvo 61.11, a onda i 63.34, kao WHQL kandidat) su upravo
učinili da GeForce 6800 Ultra preuzme vodstvo od X800 XT (koju smo takođe već
testirali) u većini igara i benchmark programa. Situacija bi bila znatno drugačija
da smo ranije testirali nV40, uz pomoć upravljačkih programa FW verzije 56.xx.
Još jedan kec u rukavu za nVidiu može biti i Direct X 9.0c, kada će konačno i
Pixel Shader 3.0 mogućnosti novog monstruma doći do izražaja.
nV40 jeste predstavljen tridesetak dana pre nego što je ATI odgovorio sa R420,
međutim, čak dva meseca je bilo potrebno da ove kartice uđu u proizvodnju, da
bi nam proizvođači poslali sempl kartice. Tako su nam stigli modeli sa potpisima
kompanija Microstar, Gainward i Leadtek. Čipove sa 16 pipeline jedinica nije
jednostavno proizvesti, pa je i X800 XT kasnio u odnosu na nV40 Ultra modele
– X800 Pro, podsetićemo, koristi R420 sa 12 aktiviranih pipeline jedinica.
nV40 je svakako impresivan video procesor, ali bi možda i delovao manje revolucionarno,
da su nV30, nV35 i nV38 bili projektovani drugačije. Nije bilo potrebno da FX5800,
5900 i 5950 budu napredniji u nekom evolutivnom smislu, već samo drugačije organizovani.
Šta je bilo loše kod ovih GPU-ova? Pipeline jedinice, odnosno video procesor kao
takav, ima zadatak da da informaciju o boji svakog piksela koji će u određenom
trenutku biti iscrtan na ekranu. Kako najjači predstavnici CineFX i CineFX 2.0
generacije imaju četiri ovakve jedinice sa po dva potprocesora za teksturisanje
(TMU), jasno je da u ciklusu mogu da iscrtaju ukupno osam piksela, ali sa dve
različite teksture. Međutim, ovo je moguće samo u slučaju igara koje imaju tzv.
fiksne funkcije i čiji je engine realizovan tako da na objekat postavlja osnovne,
color mape, a onda i teksture osvetljenja (detaljne teksture, refleksije okoline,
senke ili neravnine) “preko” nje. Ovakvi engine-i su bili u široj upotrebi u vremenu
kada je nV30 razvijan, ali je mnoštvo izdavačkih kuća najavljivalo i nove igre
bazirane na njima.U pitanju su starije igre koje se ne oslanjaju na upotrebu kompleksnijih
Shadera, i koriste klasično multiteksturisanje, pa je za njihovo brže izvršavanje
pogodnija 4 x 2 arhitektura. Nažalost po nVidiu, već u to vreme su počeli da se
pojavljuju naslovi koji se ne obraćaju kompajleru, a ovaj grafičkom čipu na nivou
pipeline-a, nego Shader jedinice, koja onda svaku scenu tretira kao single-teksturisanu.
Drugim rečima, efekat osvetljenja, refleksije, prozirnosti ili neravnine se kalkuliše
na nivou piksela, a ne teksture. U ovim situacijama, nV35 i 38 ne mogu da iskoriste
obe teksturne jedinice po pipeline-u, te tako polovina fill-rate-a iz specifikacije
ostaje praktično neiskorištena. Celu priču smo maksimalno pojednostavili, da ne
bi dublje zalazili u tematiku. Na kraju krajeva, ne želimo da pričamo o nečemu
što i nVidia želi da zaboravi.
Možemo se, samo još ovaj put, podsetiti i trenutka kada su ljudi iz nVidie
“napali” tvorce 3DMark programa, kada je verzija 03 ugledala svetlost dana.
Davali su izjave kako 3DMark03 jednostavno ne simulira aplikacije na realan
način, zbog toga što ne koristi multitexturing. Nažalost, Finci su bili u pravu
– osim još uvek aktuelnih igara kakvi su Call of Duty (priprema se i nastavak
na istoj softverskoj osnovi) ili Jedi Academy, nema novih naslova koji se oslanjaju
na multiteksturisanje. Upravo zbog svega gore navedenog, bilo je logično za
očekivati da će nV40 biti grafički procesor sa barem dvanaest pipeline jedinica
sa po jednim TMU-om. nVidia je odlučila da uzvrati udarac i povrati poverenje,
ali i podigne imidž kompanije, uči na starim greškama i pravi bolje promišljene
poteze. Tako je odlučeno da najjači modeli nove serije grafičkih kartica imaju
čak šesnaest pipeline jedinica, čak i po ceni obaranja radnih frekvencija i
ponovnog druženja sa ekstremnim rashladnim sistemima. Ovakva politika se isplatila,
ovoga puta…
Nije mala stvar…
napraviti procesor koji na silicijumsku “pločicu” površine oko 300 kvadratnih
milimetara integriše 222 miliona tranzistora. Jezgro nema klasičan heat-spreader,
ali je njegova površina veoma glatka. Procesor je izveden na pločicu dimenzija
40 x 40 milimetara, pinovi su, prirodno, smešteni ispod, po Ball Grid Array standardu.
Pogledajmo tabelu:
ATI
RADEON X800 XT Platinum Edition
ATI
RADEON 9800 XT
NVIDIA
GeForce 6800 Ultra
NVIDIA
GeForce FX 5950 Ultra
Tehnološki
proces
130
nanometarski low-k
150
nanometarski low-k
130
nanometarski
130
nanometarski
Broj
osnovnih poluprovodničkih elemenata
160
miliona
110
miliona
220
miliona
125
miliona
Radna
frekvencija GPU-a
520
MHz
412
MHz
400
MHz
475
MHz
Memorijska
magistrala
256-bit
DDR / DDR2 / GDDR3 SDRAM
256-bit
DDR / DDR2 SDRAM
256-bit
DDR / DDR2 / GDDR3 SDRAM
256-bit
DDR SDRAM
Radna
frekvencija memorije / maksimalna količina
560
MHz (1120 DDR) / 512 MB
365
MHz (730 DDR) / 256 MB
550
MHz (1100 DDR) / 512 MB
475
MHz (950 DDR) / 256 MB
Memorijski
propusni opseg
33.4
GB/s
21.8
GB/s
32.8
GB/s
28.3
GB/s
Interfejs
AGP
3.0 4x/8x
AGP
3.0 4x/8x
AGP
3.0 4x/8x
AGP
3.0 4x/8x
Pixel
Shader
2.x
2.0
3.0
2.x
Statički loop i grananje
da
ne
da
ne
Dinamički
loop i grananje
ne
ne
da
ne
Multiple
Render Targets
da
da
da
ne
Floating-Point
Render Target
da
da
da
ne
Najveći
broj teksela po “kloku”
16
8
16
4
Najveći
broj obrađenih Z vrednosti po ciklusu
16
8
32
8
Broj
teksturnih semplova
16
8
16
8
Najviši
nivo anizo filtera
16
x
16
x
16
x
8
x
Vertex
Shader
2.0
2.0
3.0
2.x
Broj
Vertex jedinica
6
4
6
3
Statički loop i grananje
da
da
da
da
Dinamički
loop i grananje
ne
ne
da
da
Čitanje
tekstura iz vertex shader-a
ne
ne
da
ne
Antialiasing
algoritmi
Rotated-grid
multi-sampling,
temporal anti-aliasing
Rotated-grid
multi-sampling
Ordered-grid
super-sampling,
Rotated-grid multi-sampling,
super-sampling + multi-sampling
Super-sampling,
multi-sampling,
ordered-grid super-sampling + multi-sampling
Maksimalni
nivo antialiasinga
2,
4, 6
2,
4, 6
2
do 8 (sa kombinovanim modovima)
2
do 8 (sa kombinovanim modovima)
Hidden
Surface Removal (HSR)
da
da
da
da
Texture,
Z-buffer, frame buffer compression
da
da
da
da
Fast
Z-buffer clear
da
da
da
da
Očekujemo da će većina 6800 Ultra kartica moći da se overklokuje do 450 MHz za
jezgro i do barem efektivnih 1200 MHz za memoriju. Ovih 50 MHz ubrzanja mnogo
znače nV40 platformi, što smo mogli da vidimo testirajući Gainward karticu sa
vodenim hlađenjem na Ultra Extreme frekvencijama (475 / 1200 MHz). Potrebno je
da prođe malo vremena, kako bi se proizvodni proces usavršio. Vremenom može doći
i do malih korekcija na referentnom PCB-u (od strane proizvođača), ali će za korektno
hlađenje i dobar overkloking i dalje biti potreban masivan i kvalitetno izveden
kuler. Verovatno je mnogima već poznato da nVidia preporučuje napajanje od 480
W za GeForce 6800 Ultra kartice. U pitanju je predostrožnost: u kompaniji ispravno
razmišljaju, te su došli do zaključka da mnogi korisnici koji bi sada kupili ovakvu
karticu imaju veoma moćnu ali i struje gladnu konfiguraciju. Za ovakve sisteme,
standardna su dva hard diska, dva IDE uređaja, ploča sa overklokovanim procesorom
(poslednja generacija iz Intela i AMD-a “vuče” oko 100 W), te veliki broj periferija
itd. Jasno je da ovakvi sistemi za sebe rezervišu dobar procenat snage PSU-a (Power
Supply Unit), te nVidia ne želi da korisnik koji je ranije imao FX5900 ili neki
Radeon pazari novi nV40 i zaključi kako radi nestabilno. Pored toga, jeftina kućišta
obično imaju napajanja deklarisana na 300 ili 350 W, koja nažalost, realno imaju
tek od 60 do 70% te snage. Skuplja i kvalitetnija napajanja deklarisana i na 360
W, dobro će poslužiti u sistemu sa GeForce 6800 Ultra karticom, barem ako gledamo
naša i iskustva kolega iz zemlje i inostranstva.
GeForce 6800 familija
nVidia GeForce 6800 Ultra je najjači predstavnik CineFX 3.0 familije kartica,
ako ne računamo ograničenu seriju Ultra Extreme predstavnika. Core je predviđen
da radi na 400 MHz, a 256 MB GDDR3 memorije na 550 MHz (ef. 1100 MHz). Kako
ima 16 pixel pipeline jedinica, svaka sa po jednim TM Unit-om, teoretski, fillrate
je niži u odnosu na Radeon X800 XT, čije jezgro radi na 520 MHz u startu. Za
razliku od situacije kod prethodne generacije, sada najbrži ATI GPU radi na
višim frekvencijama od najbržeg GeForce čipa. Tada stečeno iskustvo nam nagoveštava
da to ne mora da znači i brži finalni proizvod.
GeForce 6800 GT koristi isti GPU i PCB, ali i single slot hlađenje. nV40 je podešen
na 350 MHz, a GDDR3 memorija (256 MB) na 500 (1000 DDR) MHz, pa je na kartici
prisutan samo jedan molex konektor. Tu su i jeftiniji, i po deklaraciji nešto
sporiji Samsung memorijski čipovi (2 ns, u odnosu na 1.6 ns kod Ultre). Ova kartica
bi u prodaji trebalo da košta nekih 90 do 100 evra manje od najskupljeg i najbržeg
modela, a po prvim testovima, može se odlično overklokovati (do nivoa Ultre).
Iako ne volimo da donosimo rane zaključke, mislimo da će 6800 GT biti vrlo uspešan
proizvod, pogotovo u kasnijoj fazi proizvodnje, kada i Samsung (GDDR3 memorija)
i IBM (nV40) usavrše svoje proizvodne procese.
GeForce 6800 je izrađen oko nV40 GPU-a, ali sa nešto drugačijom štampanom pločom.
U grafičkom čipu je isključen jedan Quad Pipe Unit, odnosno jedna četvrtina od
ukupno 16 pipeline jedinica. Radna frekvencija jezgra je smanjena na 325 MHz i
predviđena je regularna DDR memorija koja može da radi na standardnih 350 (700
DDR) MHz. Proizvođači će se najverovatnije odlučiti za kvalitetne čipove od 2.8
ns, dok se možda na nekom modelu namenjenom za overkloking, mogu naći i DDR memorije
sa latencijom od 2.2 ili 2.0 ns. I na kraju, evo zvanične specifikacije nV40 video
procesora.
CINEFX 3.0 SHADING ARCHITECTURE
• Vertex Shaders
° Support for Microsoft DirectX 9.0
Vertex Shader 3.0
° Displacement mapping
° Vertex frequency stream divider
° Infinite length vertex programs*
• Pixel Shaders
° Support for DirectX 9.0 Pixel Shader 3.0
° Full pixel branching support
° Support for Multiple Render Targets
(MRTs)
° Infinite length pixel programs*
• Next-Generation Texture Engine
° Up to 16 textures per rendering pass
° Support for 16-bit floating point
format and 32-bit floating point format
° Support for non-power of two textures
° Support for sRGB texture format for
gamma textures
° DirectX and S3TC texture compression
• Full 128-bit studio-quality floating point
precision through the entire rendering
pipeline with native hardware support for
32bpp, 64bpp, and 128bpp rendering
modes
NVIDIA HIGH-PRECISION DYNAMIC-RANGE
(HPDR) TECHNOLOGY
• Full floating point support throughout
entire pipeline
• Floating point filtering improves the
quality of images in motion
• Floating point texturing drives new levels
of clarity and image detail
• Floating point frame buffer blending gives
detail to special effects like motion blur
and explosions
• New rotated-grid antialiasing removes
jagged edges for incredible edge quality
INTELLISAMPLE 3.0 TECHNOLOGY
• Advanced 16x anisotropic filtering
• Blistering-fast antialiasing and
compression performance
• Support for advanced lossless compression
algorithms for color, texture, and z-data at
even higher resolutions and frame rates
• Fast z-clear
• High-resolution compression technology
(HCT) increases performance at higher
resolutions through advances in
compression technology
ULTRASHADOW II TECHNOLOGY
• Designed to enhance the performance of
shadow-intensive games, like id Software’s
Doom III
ADVANCED ENGINEERING
• Over 220m transistors
• Designed for PCI Express x16
• Supports PCI Express high-speed
interconnect (HSI) technology for
bidirectional interconnect protocol
conversion
• Full support of AGP 8X including Fast
Writes and sideband addressing
• Support for the industry’s fastest GDDR3
memory
• 256-bit advanced memory interface
• 0.13 micron process technology
• Advanced thermal management and
thermal monitoring
• 40 mmx40 mm, BGA flip-chip package
ADVANCED VIDEO AND DISPLAY
FUNCTIONALITY
• Dedicated on-chip video processor
• MPEG video encode and decode
• WMV9 decode acceleration
• Advanced adaptive de-interlacing
• High-quality video scaling and filtering
• Integrated NTSC/PAL TV encoder
supporting resolutions up to 1024×768
without the need for panning with built-in
Macrovision copy protection
• DVD and HDTV-ready MPEG-2 decoding up
to 1920x1080i resolutions
• Dual integrated 400 MHz RAMDACs for
display resolutions up to and including
2048×1536 at 85Hz.
• Dual DVO ports for interfacing to external
TMDS transmitters and external TV
encoders
• Microsoft® Video Mixing Renderer (VMR)
supports multiple video windows with full
video quality and features in each window
• VIP 1.1 interface support for video-in
function
• Full NVIDIA® nView™ multi-display
technology capability
NVIDIA® DIGITAL VIBRANCE CONTROL™
(DVC) 3.0
• DVC color controls
• DVC image sharpening controls
OPERATING SYSTEMS
• Windows XP
• Windows ME
• Windows 2000
• Windows 9X
• Macintosh OS, including OS X
• Linux
API SUPPORT
• Complete DirectX support, including the
latest version of Microsoft DirectX 9.0
• Full OpenGL, including OpenGL 1.5
CineFX 3.0 – Vertex Shader
Za razliku od prethodnih generacija, CineFX 3.0 arhitektura procesora je osmišljena
tako da se i u postojećim čipovima mogu onesposobiti delovi rendering pipeline-a,
kako bi se dobio pogon za slabije modele. Isto tako, sada je mnogo lakše napraviti
jednostavniji GPU, bez žrtvovanja ijednog feature-a koji ima najjači model.
nV40 ima 16 pipeline jedinice, koje su, slično kao kod konkurenta, organizovane
u četiri Quad Unita (2 x 2), svaki sa po jednim Texture Management potprocesorom.
Tu je i šest Vertex Shader koprocesora. I po prvoj shemi, jasno je da se nova
arhitektura dosta razlikuje od prethodne. nVidia označava ovu arhitekturu kao
16 x 1 ili 32 x 0, što u prevodu znači da nV40 procesira 16 piksela po kloku
sa informacijom o boji i Z vrednosti, ili 32 piksela po kloku, samo sa informacijom
o dubini. Analogno tome, nV30, nV35 i nV38 su imali 4 x 2, odnosno 8 x 0 arhitekturu.
Zbog čega nVidia uopšte daje ovakve informacije? U single textured 3D aplikacijama
(većina scena u 3DMark03 i gotovo sve nove D3D igre), nV40 može da iscrta 16
piksela po kloku (nV30, nV35 i nV38 mogu samo četiri), dok u multitexturing
okruženju i nV40, i prethodnici mogu obojiti maksimalno po 8 piksela po kloku.
Postoje i situacije pri kalkulisanju, recimo, senki, gde je bitna samo Z informacija
(za Stancil Buffer) – kada nV40 može dati kalkulaciju za 32 piksela po kloku,
dok nV30, nV35 i nV38 mogu samo osam. Postaje nam sve jasnije kako nV40 postiže
toliko visoke rezultate, zar ne?
Cine FX 3.0 – Vertex Shader
Prethodne CineFX generacije GPU-ova su podržavale Vertex Shader verzije 2.0,
FP32, 24, 16 i parcijalnu, takozvanu FX12 preciznost. Nažalost, FP32 kalkulacije,
prethodnici su izvršavali dosta sporije od FP16 ili FX12, pa je puna preciznost
potpuno isključena kao opcija. Naravno, to nije slučaj kod nV40, koji podržava
Shader Model 3.0, odnosno Direct X 9.0c i nedavno apdejtovan OpenGL verzije
1.5. Shader Model 3.0, nVidia je implementirala radeći blisko sa Microsoft-om.
Ako se setimo, na implementaciji SM2.0, radili su ATI i Microsoft, dok je nVidia
bila po strani. Stvari se, svakako, menjaju iz korena. Poznato je da je za Direct
X 9.0c neophodna FP32 preciznost, koju ATI X800 ne podržava. Koliko vremena
će biti potrebno da FP32 postane šire rasprostranjen, zavisi i od Microsofta,
programera zabavnog softvera i nVidie. Ostaje pitanje i da li će mainstream
i low end GPU-ovi iz nV4x familije imati SM3.0 kompatibilnost, ili će biti derivati
prethodne generacije, sa nekim novinama pozajmljenim od nV40. Tech PDF koji
nam je poslala nVidia, veoma je detaljan, ali ćemo se potruditi da čitaocima
sažmemo ovo štivo i učinimo sve jednostavnijim. Postoji jedna teorija, koja
kaže da će pisac svake naučno-popularne knjige prepoloviti broj potencijalnih
čitalaca sa svakom narednom matematičkom formulom.
nV40 ima šest VS jedinica. Prethodne su mogle da rade sa maksimalno 256 instrukcija
(2^8), dok novi Vertex Shader razume i programe sa 65356 instrukcija, odnosno
dva na šesnaesti (2^16). Vertex Shader u okviru nV40 ima i povećan broj privremenih
registara (32). Mogućnost Shadera za Dynamic Flow Control je bila implementirana
i u nV3x procesore, međutim, tadašnja verzija Direct X API-ja (9.0) nije bila
u stanju da je adekvatno aktivira. Programeri sada mogu da pišu programe sa ogromnim
brojem grananja i zaokreta, bez potrebe da GPU, recimo, radi preliminarne kalkulacije
celog programa, samo da bi bio izvršen krajnji efekat. Ovako je jedan shader program
dovoljno inteligentan da može sadržati informacije za primenjivanje više različitih
efekata nad objektom, ili možda, informacije o osobinama materijala od koga je
napravljen. Ovo je i dalje vrlo napredna SM3.0 mogućnost – programeri će još neko
vreme radije pisati posebne, kratke shader programe za opisivanje svake mogućnosti,
radi kompatibilnosti, iako je to u principu naporniji posao.
Vertex Texture Fetch je dalje razrađivanje teme Displacement Mapping, koji podržava
i konkurencija, a prvi je predstavio Matrox sa GPU-om Parhelia 512. ATI Radeon
familija 9xxx i X800 podržavaju ovu funkciju preko n-Patches sistema. Ukratko
ćemo podsetiti da se radi se o vrlo zanimljivoj mogućnosti da se jednostavan model
obogati “geometrijom” pomoću mape koja sadrži informacije o visini piksela u odnosu
na površinu objekta. Ostaje pitanje i da li će Displacement Mapping zaživeti sad
kada je posao prebačen na Vertex Shader, koji direktno mapira informacije sa displacement
mape na vertices u realnom vremenu. Iako se mnogima može učiniti da je tehnologija
normal mapiranja naprednije rešenje, Displacement Mapping je pogodniji za bogato
definisanje velikih terena, jer su monohromatske mape memorijski manje zahtevne
i kada su velikim rezolucijama, za razliku od normal mapa, koje sadrže daleko
veći broj (kolornih) informacija, te su i samim tim memorijski veće, ali pogodnije
za definisanje manjih objekata.
Geometry Instancing je mogućnost koju izvršava Vertex Frequency Stream Divider.
Ona će biti korisna u scenama u kojima imamo ogroman broj istih ili „sličnih“
objekata, kakve su 3D real time strategije. Geometry Instancing omogućava kreiranje
duplikata objekata jednom komandom za svaki tip. Moguće je čak kreiranje i više
različitih varijacija jednog objekta (recimo, isti model drveta, kome je jedna
od osa duža ili kraća, kako bi se postigao efekat raznolikosti). Tako program
pamti samo pozicije objekta, a GPU iscrtava isti tip (eventualno sa varijacijama)
na te lokacije. Dobra strane ove mogućnosti je poprilična ušteda na memorijskom
bandwidth-u, ali je loša što mora biti podržana od strane aplikacije.
Cine FX 3.0 – Pixel Shader
Već smo pomenuli koliko Pixel Shader jedinica ima novi nVidia GPU najviše klase
i da “na” svakom postoji po jedan TMU. Takođe, može se reći da su iste razloge
imali i nVidia i ATI da ove jedinice organizuju u četiri Quad Pipe celine. Procesor
je tako skalabilniji, a pikseli koje obrađuje jedan Quad Pipe često imaju slične
reference, pa bafer može da se deli, pogotovo u situacijama u kojima se generalno
rade veće aproksimacije, kakve su igre sa fiksnim funkcijama ili jednostavnijim
Shader programima. Svaki Quad Pipeline (pored četiri pipeline jedinice) ima
i sopstvenu L1 keš memoriju. Tu je i L2 keš koji opslužuje ceo Pixel Shader.
Nova, Superscalar arhitektura podrazumeva pravu SIMD logiku (Single Instruction
Multiple Data), ali i dve ALU jedinice po pipeline-u. Prva uvek radi kopiranje
i normalizaciju teksture, druga na njoj već radi Shading operacije. Ako imamo,
recimo, shader program koji zahteva četiri aritmetičke operacije i jednu teksturnu,
tada će jedan ALU u okviru prethodnih GeForce čipova moći da izvrši prvo 80%
(od ukupnog posla) jedne vrste kalkulacija, a zatim ponovo pročita informacije
iz teksture i odradi ostalih 20% (druge vrste kalkulacije). Superscalar arhitektura
podrazumeva da drugi ALU radi teksturne operacije za sve vreme dok prvi ALU
radi aritmetičke (i onda ga “sačeka“). U nekim drugim situacijama (50 : 50%),
ušteda je daleko veća.
tradicionalna arhitektura
pixel shadera(CineFX, CineFX 2.0)
superscalar arhitektura (CineFX
3.0)
Pixel Shader 2.0 je ograničen na svega 96 instrukcija po programu, dok PS3.0
podrazumeva 65356 instrukcija kao maksimum. Ovo omogućava da se programi koji
su ranije deljeni izvršavaju daleko brže, ali omogućava i pisanje daleko kompleksnijih
shadera (realističnije osvetljenje, senčenje, materijali). CineFX 2.0 akceleratori
su podržavali do 512 instrukcija, zbog čega je nVidia “definisala“ Pixel Shader
2.0a. Sličan je slučaj i sada, jer nV40 podržava praktično “beskonačan” broj
instrukcija, ali ga SM3.0 ograničava na 65356. Tako nVidia može da tvrdi da
njihov novi GPU prevazilazi Direct X 9.0c specifikaciju. Shader Model 3.0 zahteva
FP32 preciznost, koju su podržavali i nV3x GPU-ovi, dok SM 2.0 zahteva minimalno
FP24. Iako je Vertex Shader kod prethodne CineFX generacije podržavao Dynamic
Flow Control, tek je sada ova funkcija implementirana u Pixel Shader.
Multiple Render Targets je funkcija koju je konkurent predstavio na prethodnoj
generaciji video akceleratora. Radi se o funkciji koja upisuje informacije o već
izvršenim kalkulacijama, u posebne bafere, te ih posle samo apdejtuje na druge
objekte. Iako se kalkulacije ponovo izvršavaju, upisivanje istih delova koda se
preskače, i time štedi na vremenu. Ova mogućnost je vrlo korisna pri kalkulaciji
senki iz više različitih svetlosnih izvora.
GasStation Demo – iz vremena
CineFX 2.0 akceleratora, primer za Multiple Render Targets
Da bi sirova snaga Pixel Shader jedinica bila veća, broj konstantnih i privremenih,
kao i specijalizovanih registara je morao biti povećan. Mali broj registara i
njihova neadekvatna organizacija, najveći su krivci za sporost izvršavanja Shadera
na GeForce FX karticama. Centroid Sampling je, recimo, jedna od novih funkcija,
koja ispravlja nedosledno umekšavanje ivica u pojedinim, novijim igrama koje koriste
takozvane “packed” teksture. Kada osnovni deo površine objekta biva teksturisan
pikselom ili grupom piksela koji (bojom) ne odgovaraju toj strani objekta (referenca
za popunjavanje ivica može biti uzeta sa površine koja se i ne vidi u tom trenutku).
Tada Centroid Sampling uzima grupu piksela iz centra semplovane površine, na koju
procesira umekšavanje. Flexible Data Type Support je naziv za mogućnost nV40 GPU-a
za nativni FP16 ili FP32. Dakle, ako aplikacija podržava samo FP16, GPU neće raditi
u FP32 režimu i trošiti resurse. nVidia tvrdi da nV40 jednako dobro radi u FP32
i FP16 modu, te da je razlika u performansama zaista minimalna. Pixel Shader 3.0
omogućava programerima i dizajnerima zabavnog softvera da na jednostavan način
implementiraju Subsurface Scattering. Ova funkcija je korisna za generisanje materijala
na površinama objekata, koji imaju volumen i debljinu.
Tu su i meke senke, kao i Enviroinmental i Ground senke, koje kreiraju objekti
kao što je brdo ili veća zgrada, i bez smanjenja performansi. Ove senke se realizuju
u stancil buffer-u, tako da više nema potrebe za klasičnim shadow mapama, Env.
i Ground Shadows se takođe kalkulišu realno i u odnosu na globalni izvor svetlosti
(kao što je Sunce). Tu je i primer za Global Ilumination: Pixel Shader program
opisuje objekat sastavljen od debelog materijala (praktično njime ispunjen) određene
boje i prozračnosti. Onda je samo potrebno postaviti određen tip svetlosnog izvora
unutar nejga…
Ultra Shadow II
O ovoj tehnologiji smo već pisali pri predstavljanju GeForce FX 5900 Ultra modela.
Kod kalkulisanja senki, potrebna je samo Z Stencil informacija, pa se nV40 ponaša
kao 32 x 0 akcelerator, odnosno može da iscrta 32 piksela po kloku. U igrama kao
što je Doom III, postoji ogroman broj objekata i različitih svetlosnih izvora,
a samim tim i ogroman broj različitih senki.
Igra je, sama po sebi, veoma mračna i možete onda predpostaviti koliko se senki
preklapa. Naravno, i tada svaka senka mora imati svoj realan oblik, ali šta je
sa onim senkama koje već “padaju” u one koje su veće i tamnije? Tada na scenu
stupa UltraShadow II, koji je do četiri puta brži od prethodnog sistema (svakako,
kada je i sam nV40 znatno brži akcelerator).
Ovaj sistem kalkuliše koji objekti (i svetlosni izvori) izlaze iza granice
(depth bound), i na koje određen broj svetlosnih izvora neće uticati. Konačan
rezultat je scena koja isto izgleda, a za koju je bilo potrebno izvršiti daleko
manji broj kalkulacija.
Samo RGB nije dovoljno…
Prethodna generacija nVidia grafičkih procesora nije podržavala Multiple Render
Targets, dok ATI čipovi, počev od Radeona 9700, jesu. nV40 podržava i MRT i
FP Render Target, pa tako i omogućava kreiranje scena sa HDR slikama, scene
koje imaju High Precision Dynamic Light Range.
RGB model, kreiran za klasične CRT monitore omogućava svakoj od osnovnih boja
da ima 256 nivoa osvetljenja, odnosno od 0..255 nivoa sive, gde je nula apsolutno
crna (0, 0, 0 : R,G,B), a 255 apsolutno bela “boja” (255, 255, 255). Broj 256
je 2 ^ 8 što odgovara jednom bajtu. Kombinovano sa tri osnovne boje, dobijamo
256 x 256 x 256 nijansi = 16.7 miliona, što može izgledati dovoljno. Svaka nijansa
je opisana integer vrednošću, pa kada shader prosledi informaciju o nivou osvetljenja
piksela od 2.43 ili 53.7, dolazi do aproksimacije, odnsono zaokruživanje na integer
vrednost.
Definicija osvetljenja od osam bita je nedovoljno i za klasične CRT monitore,
koji imaju osvetljenje od 100 do 140 kandela po metru kvadratnom. Ako srednju
vrednost osvetljenja podelimo sa 256 nivoa sive, dobijamo vrednost od oko 0.465
cd/m*m između dva susedna nivoa osvetljenja, u slučaju da je osvetljenje monitora
podešeno na maksimum. Ljudsko oko može u isto vreme da vidi razliku između 10
nijansi osvetljenja i 10 hiljada kolornih nivoa , što zajedno čini broj od 10
^ 8 boja.
Tako je jasno da nijedan monitor ne može da pokrije broj nijansi i nivoa osvetljenja
iz realnosti. Ali, prikaz osvetljenja može biti realniji ako se napusti klasičan
RGB model. Grafička kartica može da prosledi informacije o nivou osvetljenosti
piksela u FP formatu, a onda monitor jednostavno prikazuje onolike razlike u nivoima
koje je fizički sposoban da prikaže. Da li je poboljšanje vidljivo na prvi pogled?
Svakako da jeste.
Scena renderovana po standardnom
modelu
Scena renderovana po OpenEXR
color modelu
HDRI (High Dynamic Range Images) model je nezavistan od ograničenja bilo kakvog
hardvera ili medija, ali HPDR sistem implementiran u nV40 mora “biti svestan”
ograničenja koje nudi RGB. Tako se prevođenje sa HDR modela na Low Dynamic Range
model vrši preko Tone Mapping algoritama. No, kalkulacije po čistom HDRI modelu
bi bile praktično nemoguće u realnom vremenu, pre svega zbog ograničenja samog
hardvera. Zbog toga se nVidia odlučila za kompromisni model, 16-bitni OpenEXR,
koji je razvila kompanija filmskog maga Džordža Lukasa (Industrial Light &
Magic). U poređenju sa sRGB ili RGB modelom, i OpenEXR je HDR model, jer koristi
16-bita za opis kolornog kanala (10 bita za informaciju mantise i pet bitova
za informaciju eksponenta). Kreiranje i prosleđivanje kalkulacija po ovom modelu
u nV40 procesoru se sastoji od tri koraka:
Light Transport – procesiranje scene u HDR modelu i čuvanje podataka o svetlosnoj
i kolornoj informaciji piksela u OpenEXR formatu
Tone Mapping – konvertovanje HDR formata slike u LDR format pomoću pametnih
algoritama (nažalost, do ovoga mora doći) – RGB ili sRGB.
Color & Gamma Correction – dodatne korekcije vrše se u softveru i podešavaju
za konkretni CRT ili LCD monitor.
Intellisample 3.0
ATI je predstavio Temporal Antialiasing, međutim, koliko će ova funkcija biti
upotrebljivana u praksi, ostaje da se vidi. nVidia je sa prethodnom generacijom
još uvek koristila kombinacije Supersampling i Multisampling algoritama, a dosta
dobro su se pokazali i xS i Quincunx metode. Ovoga puta, inženjeri američke kompanije
su malo prepisivali od kolega sa severa i implementirali već poznat metod rotacije
grida za popunjavanje piksela na ivici objekta (rotated grid). Njihov ordered
grid metod nije bio ništa zahtevniji, ali se pokazalo da rotated grid daje bolje
rezultate. Naravno, najzahtevniji mod, osmostruki AA je i dalje kombinacija 4x
rotated grid multisemplinga i 2x supersemplinga (uvećavanje rezolucije + downscaling).
Kada je anisotropic u pitanju, i ovde ima novina, pa je 6800 Ultra prvi nVidia
akcelerator koji nudi anizotropni mod filtriranja od 16 tap. O svemu smo više
puta ranije pričali pa ćemo sada odmah preći na zanimljiviji deo:
Video procesor
Kod prethodnih generacija video akceleratora, ako ne računamo ATI-jev pokušaj
da ulepša low bandwidth video sadržaj (Fullstream), 2D i Video engine je samo
nudio osnovne kalkulacije kod procesiranja MPEG video sadržaja (dekoding). Te
funkcije su skaliranje, filtriranje de-interlacing, de-blocking i podrška u vidu
eksternog ili internog TV-enkodera. Ako video procesor može da procesira tako
kompleksnu 3D grafiku, zbog čega ne bi imao i pokoji potprocesor posvećen obradi
video signala. Uostalom, uvek nam je bilo smešno što u enkodovanju CD Audio materijala
u MP3 ili WMA format ne učestvuje zvučna kartica u onoj meri u kojoj je to logično.
Ista stvar je i sa dekodiranjem video materijala. Da ne bi CPU radio sve ovo,
nVidia je implementirala neke korisne i vrlo moderne funkcije u nV40:
• Support of adaptive de-interlacing;
• High-quality scaling and filtering;
• Removal of blocky artifacts;
• Integrated TV-coder;
• Inverse telecine (3:2 pulldown);
• Conversion of color spaces;
• Conversion of the refresh rate;
• Gamma correction;
• Noise cancellation;
• Frame Rate Conversion
• Processor amplifier;
• HDTV support (720p, 1080i, 480p, CGMS modes are supported);
• Hardware synchronization of audio and video streams;
• Support of MPEG-1/2/4 encoding/decoding;
• Support of WMV9H.264 decoding.
• WMV9/H.264 motion compensation
• WMV9/H.264 In-Loop deblocking
• DiVX Decode/Encode
• High Quality Scaling
• Hardware Audio/Video Synchronization
Video procesor koristi neke delove Pixel Pipeline jedinice, dok su neke celine
posebno kreirane u ovu svrhu. NVidia tvrdi da dekodiranje MPEG2 materijala oslobađa
resurse do 95%, dok enkodovanje oslobađa resurse do 60%.
Dekodiranje MPEG2 materijala
Zanimljivo je da i neki zaista kompleksni efekti mogu biti primenjeni na sam video
u realnom vremenu. Neki od njih su do skoro bili rezervisane za skupe studijske
video kartice, kakve proizvodi Matrox, na primer. Po našem mišljenju, veoma važna
je i podrška za hardverski MPEG2 / 4 i WMV9 video enkoding i dekoding, kao i podrška
za HDTV standard. Najlepše od svega je što je i video procesor programabilan,
te se hardverska podrška za nove video standarde lako može dodati u novim revizijama
drajvera.
Enkodiranje MPEG2 materijala
ForceWare 6x.xx – “Detonator” u formi
ForceWare drajveri serije 6x.xx, koja je predstavljena paralelno sa promocijom
nV40 čipa, nude zaista mnogo novih opcija. Pored mogućnosti totalne kontrole anizotropnih
i trilinear optimizacija, tu su i nove olakšice i funkcije za Dual View rad: pametni
kursori, one touch raspored ekrana, nove shortcut definicije, pop up block-eri
za Internet Explorer sa naprednim podešavanjima (da, dobro ste pročitali) i zaista
još dosta toga novog…
Pored toga, NVidia insistira da se testovi rade sa Quality setovanjima u drajverima,
kao i sa uključenim optimizacijama za trilinear i trilinear + anisotropic modove.
Kako navode u tech. PDF fajlu, i ATI koristi ove optimizacije uvek, osim kada
se koriste Colored MipMap nivoi, koji otkrivaju oštrije ivice između nivoa, što
se teže primeti u igri. Evo i nekoliko rečenica iz tog fajla.
Important:This
optimization is always on for competitor’s hardware during normal use. The only
time they do “full” trilinear is when colored mipmaps are enabled to show trilinear
levels.
Note: Some competitors implementations of "optimized" trilinear
use texture analysis to effectively detect colored mipmap chains, and implement
"full" trilinear in these cases where they are present. This can be
misleading to a reviewer trying to determine where the optimization is applied.
NVIDIA sees no reason to implement this behavior
Important: Users should choose one of the above image settings based
upon their
preferences prior to selecting an antialiasing and anisotropic filtering setting.
For GeForce 6800 Ultra and GT testing versus competitive GPUs, NVIDIA recommends
setting Image Settings to Quality mode and leaving Trilinear Optimizations and
Anisotropic Optimizations On. This will provide an apples-to-apples comparison
versus the competition. Image Quality settings should contain similar levels
of optimizations. When doing comparisons on GeForce 6800 versus competitor’s
products, make sure the competitor’s settings are all set to their highest quality
settings which contain optimizations. This setting should be compared to NVIDIA’s
Quality setting which contain similar optimizations. NVIDIA’s Highest Quality
setting contains no optimizations, and this mode is not offered by our competitors.
Poređenje verzija
U našem iskustvu, drajveri verzije 61.11, a pogotovo 61.34, doneli su zaista bitna
ubrzanja i pokazali da nVidia zaista može da napravi fer optimizaciju. Evo primera
iz jedne aplikacije:
Trilinear vs. Brilinear
Koliko utiče isključivanje trilinearnih optimizacija, koje, kao što ste gore pročitali,
nVidia ne preporučuje? Pogledajmo tabelu:
Kartica na testu
Microstar je vrlo često najagilniji, jer kao najveći svetski proizvođač, ima
odlične veze sa ATI i nVidia partnerima. Uz to, i saradnja našeg sajta sa ovom
kompanijom je, kako se to u Srbiji kaže, “na nivou”, pa smo i mi dobili ekskluzivan
primerak kao referentnu karticu u narednom periodu.
MSI NX6800 Ultra dolazi u začuđujuće malom pakovanju (Microstar je konačno odlučio
da malo povede računa o šumama u Amazoniji), koje sada ima regularne dimenzije,
ali je napakovano do poslednjeg kubnog milimetra. Tu si igre kao što je URU: Ages
Beyond Myst, Prince Of Persia: Sands of Time ili Cell Shaded hit – XIII. Tu je
i Photoshop Album, pojednostavljena verzija Photoshop Elementsa, koji će se dopasti
korisnicima ACDSee-a, Virtual Drive i RestoreIT, 5.1 verzija WinDVD programa,
drajveri i utility programi kao što su LiveUpdate!, programčić koji omogućava
dinamičko overklokovane – D.O.T (sada nVidia ima sličnu opciju u svojim regularnim
drajverima). Ne treba zaboraviti i malo starije igre – Black Hawk Down, Comanche
4, Joint Ops, Deus Ex Invisible War, IL-2 Sturmovik, Splinter Cell i još neke,
kao i gomilu demoa… Skoro pa nam je MSI nadoknadio obećani Doom III (kada izađe,
moguće je da će se naći u bundle-u).
Prvi utisak o GeForce 6800 Ultra – kartica i nije toliko masivna koliko bi se
moglo učiniti na slikama. Deluje lakše od većine FX 5950 Ultra modela. Sama kartica
je izrađena prema referentnom nacrtu, što važi čak i za kuler. PCB je slične dužine
kao i onaj kod FX5900 modela, ali sa znatno manje klasičnih elektrolitskih kondenzatora,
koji su zamenjeni pasivno hlađenim MOSFET-ima.
Sa osnovne strane, smešteno je 256 MB GDDR3 memorije koje je proizveo Samsung.
Njihovo vreme latencije je fantastičnih 1.6 nanosekundi, što odgovara frekvenciji
od efektivnih 1250 MHz. Na 1100 MHz, na koliko je podešena, memorijski čipovi
ne oslobađaju veliku količinu toplote, ali je nVidia mislila i na ljude raspoložene
da dodatno ubrzaju karticu, kao i na sisteme u slabije provetrenim kućištima,
pa je i za memoriju obezbedila posebno hlađenje.
Kuler se sastoji iz više delova: metalni profil, sastavljen od tankih listića
aluminijuma, koji je specijalno ispoliran sa donje strane i sa glatkom površinom
nV40 čipa “spojen“ kvalitetnom termalnom pastom, zatim G profil koji pokriva memorijske
čipove, a koji ima i metalnu cev koja bolje raspoređuje toplotu, i na kraju centrifugalni
ventilator sa tunelom, koji uvlači vazduh i usmerava ga prema metalnim profilima.
Posebno pozdravljamo novi način montaže kulera – kod svih nV40 kartica, on je
ušrafljen, te konačno možemo reći zbogom lošim plastičnim tiplovima. Kartica ima
dva DVI konektora koji su vezani na novi Silicon Image procesor i jedan S-Video
izlaz, čiji se enkoder nalazi u samom jezgru, što je tradicija koju nVidia gaji
još od modela GeForce 4 MX. I naravno, tu su i dva molex konektora.
Zanimljivo je i što MSI u listi na samoj kutiji zahteva napajanje od 350 W, dok
nVidia preporučuje znatno jači model (480 W). Kartica radi zaista besprekorno,
kuler nije preterano bučan (na nivou Radeon 9800 Pro modela, tiši od najtiših
vazdušno hlađenih GeForce FX5950 kartica, ali opet bučnija od Radeona X800 XT…),
a kvalitet slike impresionira, bez obzira što se koriste adapteri. No, većina
zainteresovanih za NX6800 Ultra karticu verovatno ima odličan TFT monitor…
Test Setup
Kartice smo testirali na test sistemu prikazanom u tabeli:
Procesor
AMD Athlon XP 2400 MHz (fsb. 210MHz)
Matična ploča
Abit NF7-S v2.0
– powered by Enermax 360W
Memorija
2x 512 MB DDR450 @
6-2-2-2.5
Hard Disk
IBM DeskStar DTLA 120GXP
"Death Star" 60 GB
Video Karte
GeForce FX5900 Ultra
– 256 MB DDR – ForceWare 61.34
Microstar Radeon 9800 Pro – 128 MB DDR Catalyst 4.5
Microstar Radeon X800 Pro – 256 MB DDR Catalyst 4.5
Microstar GeForce 6800 Ultra – 256 MB GDDR3 ForceWare 61.34
Monitor
Samsung SyncMaster
959NF
Cooling
Thermaltake TT7+
DVD uređaj
Pioneer 116 DVD-ROM
CDRW uređaj
Sony CDRW Drive CRX220E1
Operativni sistem
Windows XP Service Pack 1 with XPLite! (optimized for performance)
Direct X 9.0b
Igre/Bench programi
Quake 3 Arena v1.17
Unreal Tournament 2003 v2166
Unreal Tournament 2004 Demo
FutureMark 3DMark 03 Professional
Aquamark 3 Commercial Plus
Activision Call of Duty
Splinter Cell: Pandora Tomorrow
Crytek FarCry 1.1
ColinMcRae 4
CodeCreatures Benchmark Demo
SpecORG ViewSPEC Perf 7.1
X2 – The Threat Rolling Demo Benchmark
Microsoft Halo for PC Retail
Napomene:
NVidia insistira na još nekoliko stvari kada je testiranje u pitanju:
The GeForce 6800 Ultra is a very powerful GPU. As a result
some games run so fast on the GeForce 6800 Ultra, that the frame rate or score
of the game/benchmark is actually limited by the CPU. Many games that were previously
not considered CPU limited are now CPU limited when playing on a GeForce 6800
GPU. To tell if your score is being CPU limited, vary the resolution/settings
of the benchmark run and see if the score does not change. Examples of games
that are mostly CPU limited when running on the GeForce 6800 GPUs include:
XIII™, Call of Duty™ (when no AA is enabled), Comanche™, 4 Command & Conquer®:
Generals™, Dungeon Siege™, Medal of Honor™, Microsoft® Flight Simulator™ 2004,
Neverwinter Nights™, Quake™ III Arena, Serious Sam™: The Second Encounter (at
1024×768 or lower), Wolfenstein™ – Enemy Territory (at 1024×768 or lower), Unreal
Tournament™ 2003 (at 1024×768 or lower, or in botmatch), Warcraft3™
NVIDIA recommends benchmarking the following applications and games to evaluate
GeForce 6 Series GPUs: Aquamark3, 3DMark® 03, Call of Duty™, Far Cry™, Halo™:
Combat Evolved, Serious Sam™: The Second Encounter, Star Wars® Jedi Knight®
III: Jedi Academy™, Tom Clancy’s Splinter Cell™, Unreal Tournament™ 2004, Wolfenstein™
– Enemy Territory, X2 – The Threat
Sintetički benchmark programi ~ 3DMark 03 – #340
Poslednja verzija 3DMark benchmark programa je pokazala i konačno dokazala kompaniji
nVidia da je napravljena greška u proceni sa arhitekturom koja integriše dve TMU
jedinice po pipeline-u. Ovaj program, iako kritikovan od strane mnogih, pokazao
je i da se mora voditi računa o brzini izvršavanja Shader programa, te da je veoma
zdravo ispoštovati do kraja DirectX 9 specifikaciju, odnosno napisati sopstveni
kompajler da što bolje sarađuje sa HLSL prevodiocem Microsoftovog API-ja. 3DMark03
je patch-ovan najnovijom zakrpom, a testirali smo na default setovanjima.
Stravičnu prednost koju donosi GeForce 6800 Ultra, zahvaljujući novoj arhitekturi
i 16 pipeline jedinica, lako je primetiti. Prednost je povećana i novim drajverima
61.34 – koji u default rezoluciji donose blizu 1000 poena u odnosu na 56.72!
Game testovi
Direct X 7 test pokazuje da je nova kartica moćnija i u situacijama u kojima se
ne koriste napredni shaderi. Pogledajte koliko je 6800 Ultra brža od prethodne
nVidia generacije…
Koliko će 6800 Ultra biti u prednosti u igrama tipa Doom III? Možda ovaj test
to najbolje pokazuje…
I ovde je prednost više nego očigledna. Zapamtite ove cifre, naredne nedelje će
X800 XT pokušati da uzvrati udarac.
Test koji ima mnogo Pixel Shader programa specifikacije 2.0. Ponovićemo da, na
samom početku, kada “kamera” počinje da se diže sa vode na krajolik, broj frejmova
na Radeon 9800 XT kartici pada na 14, kod GeForce FX 5900 na 7 do 9 fps, na modelu
X800, je, u istom trenutku, bio zakucan na 28 fps, dok je kod GeForce 6800 Ultra
kartice na nivou od oko 24 do 25 fps. Ipak, rezultati gore u tabeli pokazuju prosečan
broj frejmova po sekundi. Jasno je da će ovde Radeon X800 XT doneti još veću prednost
u odnosu na najjači GeForce.
Zanima vas kako radi GeForce 6800 Ultra Extreme? Pogledajte, za sada, jednu tabelu…
AquaMark Commercial Plus
Novi benchmark program karakterističan po velikom broju feature-a za testiranje
mogućnosti Direct X 7, 8 i 9 kompatibilnih video kartica. Koristili smo maksimalan
nivo detalja, test se izvršava bez zvuka, a anisotropic i antialiasing filteri
su bili isključeni. Nismo dali ukupan rezultat već prosečan frame rate po rezoluciji.
GeForce 6800 Ultra je ovde pokazao prednost, mada nije toliko brži koliko bi možda
trebalo. I svakako, u višim rezolucijama, nV40 nikako nije ograničen centralnim
procesorom.
CodeCult Codecreatures Standard Benchmark
I dalje jedan od najlepših i najzahtevnijih testova koje koristimo je CodeCreatures
Benchmark. Baziran je na engine-u koji koristi Shadere verzije 1.3 (Direct X 8),
i odlično ukazuje na to kako se kartica snalazi sa teksturama veoma visoke rezolucije
i velikom količinom poligona. Vizuelna atraktivnost i fotorealističnost su i po
današnjim standardima na visokom nivou, ali je igra Far Cry definitivno za klasu
nadmašila ovaj test, barem u vizuelnom aspektu. Default test se izvršava u tri
rezolucije: 1024×768, 1280×1024 i 1600×1200. Moguće je kreirati batch u kome je
ćete izabrati sopstvene modove od rezolucija 640*480 do najvišeg grafičkog moda
koji kartica podržava.
Sličan komentar može da se da i u ovom testu – X800 Pro daje sasvim zadovoljavajuće
rezultate.
SpecORG SpecView Perf 7.11
SpecOPS-ov OpenGL test koji pred video kartu postavlja nešto drugačije zadatke
nego što to čine poznate igre. Ovaj skup OpenGL programa testira specijalne funkcije
neke 3D kartice, koje se koriste u profesionalnim i poluprofesionalnim 3D aplikacijama
tipa CAD i 3D Modeling. Mi smo koristili smo poslednju aktuelnu verziju koji se
sastoji od šest celina. Kao što već znate, u pitanju je karakterističan i za mnoge
korisnike veoma važan test.
Real Gaming testovi / OpenGL ~ Call of Duty retail
Call of Duty je odlična single i multiplayer igra, bazirana na žestoko modifikovanom
Quake III engine-u. Kako su nivoi i do trideset puta kompleksniji i veći, jasno
je da su i rezultati koje akceleratori daju daleko niži. Precizniji i lakši benchmark
donosi aplikacija CoD Bench, koja automatizuje proces testiranja. Poželjno je
koristiti poslednju verziju igre, koja patchuje kako Single player, tako i Multiplayer
verziju, sa kojom se inače i vrši testiranje. I ovoga puta, podešavanja su bila
na apsolutnom maksimumu.
Igra pokazuje realno stanje stvari i moć nove grafičke kartice američkog dizajnera
video procesora. I dalje je pomalo nejasno zbog čega je GeForce FX 5900 dao toliko
nizak rezultat, kada smo i njega "opremili" novom verzijom drajvera…
Quake III Arena
Jednom smo već napomenuli da će Quake sa spiska test programa istisnuti samo i
jedino Doom III. Ako se to ne desi, zbog najavljene nemogućnosti za testiranje
kroz ovu igru, verovatno će tu biti još neko vreme. Verzija sa kojom testiramo
je standardna 1.17 sa x86 optimizovanim dll-ovima.
Max Quality Setting:
Teksture na najvišem nivou
Geometrija na najvišem nivou
Primenjeni: r_subdivisions 1 i r_lodError 0
High Quality Sky
Ejecting Bras uključen Sync Every frame isključen
Lightmap lights
Force Player Models isključen
Dynamic Lights uključen
Marks On Walls uključen
Sound Quality low
Naravno, sve kartice, a ponajviše GeForce 6800 Ultra, u ovom testu su ograničene
samim procesorom. Opet se možemo našaliti: kada bi samo igrali Quake III i poželeli
viši frejmrejt, očigledno bi morali da pređemo na brži sistem.
Real Gaming Testovi / Direct X 8 ~ Unreal Tournament
2003
Unreal Tournament 2003, patchovan na verziju 2166 u Direct3D izdanju. Testirali
smo sa maksimalnim nivoom detalja, zvuk je bio podešen da zauzme što manje procesorske
snage. Mapa koju smo koristili su flyby suntemple, sa odgovarajućim batchom u
Benchmark direktorijumu. Ova mapa spada u jednu od najzahtevnijih u ovoj igri.
Zanimljivo je da je ATI Radeon X800 Pro ovde pokazao brzinsku prednost, što je
očigledno stvar verzije igre i drajvera. Sigurno je da GeForce 6800 Ultra u ovoj
igri može postići daleko više rezultate…
Splinter Cell Pandora Tomorrow
Ova igra koristi modifikovanu verziju Unreal Tournament 2003 engine-a i u mnogo
većoj meri se oslanja na shadere. Karakteriše je veliki broj poligona, kombinovan
sa brojnim teksturama i dosta shader efekata (voda, stancil senke, post processing
efekti). Testirali smo na najvišim mogućim setovanjima. Iako na mnogim mestima
možete pročitati da je u pitanju Direct X 9 igra, Pandora Tomorrow ne koristi
Shader Model 2.0 programe. I ovoga puta smo morali da koristimo eksterne skripte
za testiranje.
Pošto se radi o istom engine-u, jasno je da je problem u drajverima, koji će od
najjače GeForce kartice izvući bar desetak procenata ubrzanja. Ili, možda, patch
od ljudi koji su razvili ovu igru.
Colin McRae 04
Naš testbed je svakako zaslužio da mu se pridruži i jedna popularna simulacija
reli vožnje. Ubedljivo najpopularnija i na ovim prostorima, jeste nova inkarnacija
Colin McRae relija. Iako nije napredovala od prethodne, barem u čisto tehničkom
aspektu, ova odlična igra je reprezentativan primer svog žanra, pa će mnoge zanimati
kako se ponašaju novi video akceleratori u jednom ovakvom naslovu. Igra nema ugrađen
benchmark mod, pa smo mi merenje u pauzi (koja daje rotaciju za 360 stepeni, sa
fiksnim brojem frejmova) izvršili pomoću programa Fraps.
ColinMcRae je oduvek brže radio na ATI karticama, pa nam je drago da vidimo preuzimanje
vodstva barem u 16 x 1 prema 12 x 1 duelu…
X2 – The Threat
X2 – The Threat je igra koja je nedavno izašla i privukla pažnju raskošnom grafikom,
karakteristična po detaljnim teksturama, svetlosnim efektima i particle sistemom.
Koristi Direct X 8.1, iako inicijalno zahteva instaliranje verzije 9.0. Za testiranje
nismo koristili retail verziju već rolling benchmark demo, mada i prava verzija
ima benchmark mod. Grafika je bila podešena na maksimum, a zvuk isključen.
Real Gaming Testovi / Direct X 9 ~ Unreal Tournament
2004 Official Demo
Unreal Tournament 2004 je izgrađen na sličnoj osnovi kao i naslov iz prethodne
godine (uz intenzivniju upotrebu shadera). Ovoga puta koristimo demo ove igre,
jer se daleko brže instalira i ima sve što je potrebno da bi se test uspešno izvršio.
Nažalost, u demo verziji ne postoje Highest modovi za teksture i efekte, pa su
samo geometrija i procesiranje modela podešeni na najviši nivo, dok je sve ostalo
namešteno na Normal. I u ovom izdanju, Unreal Tournament 2004 vizuelno nadmašuje
prethodnu verziju, a stoga je i nešto zahtevniji. Za testiranje smo koristili
ugrađeni Bridge of Fate demo.
U nižim rezolucijama su novi akceleratori ponovo ograničeni CPU-om, jer je GPU
load nizak (teksture su osrednjih dimenzija, geometrija je slabija). Međutim,
po igraonicama se upravo igra sa ovakvim setovanjima, pa smo zadržali demo verziju.
Halo PC
Igra zbog koje su mnogi pre dve godine kupili X-Box konzolu, fenomenalni Halo
u verziji za PC je optimizovan za Direct X 9 kartice. Program koristi Pixel Shadere
verzije 2.0. Ovi programi se mogu izvršavati i preko starijih verzija Pixel Shadera,
ali smo mi koristili DX9 mod, najveći broj detalja i trilinearni mod filtriranja.
Još jedna igra koja pokazuje ogromnu fillrate i memory bandwidth moć GeForce 6800
Ultra kartice.
Far Cry
Igra koja je po mnogima redefinisala žanr, odnosno pooštrila kriterijume kada
je vizuelni aspekt u pitanju. Ova engine je demonstracija mogućnosti Direct X
9 API-ja u praksi – tu je ogroman broj poligona i efekata koji se izvršavaju u
Shader jedinicama, celih 128 MB video memorije je po nivou rezervisano i zajedno
sve izgleda jednostavno fenomenalno. Fotorealistična grafika i do sada najbolja
fizika i dizajn nivoa su atributi ove fenomenalne igre. Tu su efekti Normal mapiranja,
polybump mappinga, napredne enviroinment fizike, promenljiva geometrija terena,
dinamičke senke i osvetljenja, motion capture animacije… Testirali smo sa Very
high i Ultra high podešavanjima (gde je moguće), uz pomoć već snimljenog i opšte
prihvaćenog demoa, koji koriste i strane kolege (X-BitLabs, DigitLife, HardOCP).
Nažalost, još uvek nije izašao patch koji bi popravio stanje stvari i pomirio
FarCry sa GeForce 6800 Ultra i 61.xx drajverima… Kvalitet slike je zaista mnogo
lošiji čak i od onog koji nude iste kartice sa 5x.xx drajverima. Očigledno je
da se čeka Direct X 9.0c i Patch 1.2 (mada i 1.1 podržava SM 3.0), pa ćemo videti
koliko će to usporiti nVidia karticu.
Painkiller
Ovaj sveži naslov pokreće moderan Direct X 9 engine i koristi dosta postprocessing
i stancil efekata. Najupečatljivije su senke i rag-doll fizika, zatim full scene
efekti koji se primenjuju u realnom vremenu (poseban mod koji transformiše percepciju
nivoa). Ponovo smo testirali na najvišem nivou detalja, a u tome nam je pomogao
demo skinut sa popularnog stranog foruma i fraps utility.
Zahtevni modovi ~ Antialiasing
Anisotropic
Antialiasing + Anisotropic
Overclocking
Iako je D.O.T zaista odličan način da overklokujete vašu karticu, a
da ne strepite, mi smo, ipak, ručno, doveli karticu do odličnih 455 / 1170 MHz,
uz očuvanje maksimalne stabilnosti. Kartica uz dodatno hlađenje, može da se
ubrza do fantastičnih 465 / 1200, što je bezmalo nivo 6800 Ultra Extreme modela.
Sa druge strane, budite spremni na više buke, pošto je dodatna osmica, naslonjena
na samu grafičku karticu, bučnija nego kuler na samom akceleratoru.
Zaključak
nVidia je konačno pokazala svima. nV40 je moćan, brz, kompleksan i veoma moderan
GPU koji će sigurno naterati konkurenciju da ozbiljno poradi na R5xx familiji
akceleratora. Nisu u pitanju samo mogućnosti video enkodinga, nove sitnice koje
ćete koristiti u dual view režimu rada ili odličan kvalitet slike. To možemo
očekivati i od jeftinijih izdanja CineFX 3.0 familije akceleratora. Radi se
o izuzetnim performansama, koje će doći do izražaja u kompleksnim igrama kao
što je, u prvom redu Doom III, a onda i Half Life 2, STALKER i druge. Pozitivne
promene su uočene i kod pisanja drajvera. nVidia sada ima dvostruke razloge
da bude poštena i maksimalno povrati poverenje u svoje upravljačke programe,
koji su po funkcionalnosti prevazišli kategoriju kojom se imenuju. Najveća prednost
– podrška za Shader Model 3.0 i Flow Control je nešto što sada sigurno peče
ljude u ATI-ju. Možda još ne finansijski, možda ni renome još nije počeo da
biva narušen, ali je jasno da je nVidia ponovo, ako ne uvek brzinski, onda makar
tehnološki šampion kome ovoga puta treba skinuti kapu. Istina je da je kartica
glomazna, da je sistem za hlađenje udaljava od SFF računara, istina je da ćete
možda morati da pazarite i moćno napajanje, ali verujemo da će se sve to isplatiti.
Takođe, mislimo da će GeForce 6800 GT biti najpopularniji model – ubrzo će većina
ovih kartica moći da se overklokuje ne samo do 400, već verovatno i do 450 MHz
za core i oko 1100 MHz za memoriju, što je više nego dovoljno, pogotovo za sumu
koja je do 100 evra niža od one koju je potrebno izdvojiti za Ultra model. Nadamo
se da će sledeća revizija drajvera i Direct X 9.0c pokazati da nV40 može da
bude i impresivniji, ali se pomalo plašimo da će procesor biti sporiji u SM3.0
režimu, bar u samom startu.
nV40 je odličan za krajnjeg korisnika. Ovo nemojte shvatiti kao trenutnu preporuku
za video karticu od 440 evra. Uspeh nV4x familije je važan za nVidiu i industriju
uopšte. Prijateljima iz kompanije Microstar još jednom zahvaljujemo i čestitamo
na još jednom uspešno realizovanom proizvodu.
Korisna adresa: Microstar
SCG