nVidia GeForce 7800GTX – MSI NX7800GTX
Uvod
Trenutak smene generacija video procesora je opet pred nama. Entuzijasti čekaju
prve primerke najjačih akceleratora na policama radnji, a najnestrpljiviji su
verovatno nakon prvih “procurelih” rezultata odmah uradili preorder
na “Amazonu”. Najveći broj ljubitelja će sa interesovanjem propratiti celu medijsku
pompu, pročitati testove, ali će, shodno mogućnostima i potrebama, sačekati
izdanje nove tehnologije namenjeno srednjoj klasi, koje će opet ponuditi značajno
više performanse u poznatim naslovima, ili omogućiti da neke nove igre izgledaju
lepše nego što je to bilo moguće sa prethodnom generacijom. Ovoga puta, nVidia
je ponudila još kompletniji proizvod, počev od efikasnijeg rada sa real-time
3D grafikom, preko poboljšane podrške za multimediju i video visoke definicije
(koji će, kad-tad i u Evropi postati aktuelan), do sveobuhvatnije softverske
podrške “out of the box”. Tu ne mislimo samo na nove mogućnosti nove generacije
drajvera, već i na ostatak nVidia softvera koji upošljava pipeline
novog, moćnog grafičkog procesora.
Početkom aprila protekle godine, nVidia je predstavila potpuno novi i drugačiji
grafički procesor koji je oduševio javnost i dokazao da kompanija ume i može
da se vrati na staze stare slave. nV40 je ponudio fantastične performanse i
u odnosu na prethodnu generaciju Radeon baziranih akceleratora, a još više u
odnosu na neslavnu GeForce FX seriju proizvoda. GeForce 6800 Ultra, a kasnije
i njeni mainstream i budget derivati, GeForce 6600 i 6200,
doneli su pregršt noviteta, postavljajući matičnu kompaniju na tron kada je
tehnologija u pitanju. Na ovom mestu, nVidia će se sigurno zadržati sve dok
se ATI-jev R520 video procesor, na odgovarajućem akceleratoru, ne bude našao
u prodaji. S obzirom da je sada jul mesec, a da se R520 ne očekuje do kraja
avgusta, američki dizajner GPU-ova će se, kao nekad, dugo zadržati na ovom počasnom
mestu. GeForce 7800GTX, koji nikoga nije razočarao, stvorio je samo dodatne
probleme konkurenciji, te je moguće da će se nVidia zadržati “u vrhu” i dosta
duže nego što smo to mogli predpostaviti.
U periodu između promocija nV40 i G70, nVidia je napravila nekoliko vrlo značajnih
inovacija. Na prvom mestu, to je još programabilniji, mogućnostima bogatiji,
generalno univerzalniji i daleko moćniji GPU – nV40. Na ultimativno programabilan
video procesor ćemo još sačekati: u tom periodu, procesor sa arhitekturom unificiranih
shader jedinica će biti onoliko programabilan koliko mu to API i drajver omoguće,
ali će dodatne optimizacije i dogradnja arhitekture, uključujući nove instrukcije,
drugačiju organizaciju pipeline-a, lokalne cache memorije,
memorijski kontroler, povećanje broja shader jedinica, “uvek” postojati.
Drugi potez kompanije nVidia, koji se na kraju balade ipak može nazvati pametnim,
jeste SLI projekat. Ako ne pričamo samo o grafičkim karticama, moramo imati
u vidu uspeh nForce 4 SLI platforme, a ako govorimo o VGA aspektu, možemo reći
da je upravo SLI omogućio kompaniji da ima najbrži grafički sistem za PC računare.
Na trećem mestu je tržišni uspeh mainstream modela, takođe zahvaljujući
procesoru nV40; GeForce 6600 i 6600GT su, svaki u svom podsegmentu, bili veoma
popularna rešenja, pre svega iz razloga što su u kompaniji na vreme shvatili
koliko je bitno da novi akcelerator bude prisutan i u AGP izdanju (ATI do danas
nije izbacio Radeon X700 u AGP verziji). G70 svakako može postati novi nVidijin
“number one”, ali je nV40 upravo ona tačka koja označava prekretnicu u istoriji
ove renomirane kompanije.
Šta je G70, koliko je i zbog čega brži, kome je namenjen i zašto je tu, pokušaćemo
da odgovorimo na narednim “stranama” ovog testa.
G70 – sedma GPU generacija
Od 1999. kada je nVidia predstavila prvi T&L grafički procesor, GeForce
256, prošlo je gotovo šest godina, što je veoma dug period za IT industriju,
pa tako ne čudi podatak da je ovo već sedma generacija GeForce akceleratora.
Svaka naredna je, počev od prvog, nV10, donela veće ili manje novine, a nVidia
je najčešće postavljala standarde koje su ostali proizvođači pratili ili pokušali
da prate. Interna oznaka, ili “fabrički naziv”, u nekoj meri je takođe bitan,
pa je nVidia promenila dosadašnje označavanje sa nVxx u oznaku Gxx. Iako je
ovo sedma generacija GeForce GPU-a, oznaka G7 bi bila isuviše slična sa marketinškim
nazivom IBM procesora, koji su još uvek “centar zbivanja” u Apple Macintosh
računarima, te se nVidia odlučila za G70. Još uvek se pominje nV48, čija bi
arhitektura pipeline jedinice mogla da bude sličnija onoj kod G70, nego onima
u nV4x procesorima. No, još uvek je rano pričati o tome, te ćemo nastaviti naše
upoznavanje sa čipom koji se nalazi na kartici koju smo testirali.
Da bi novi grafički procesor bio toliko moćan, bilo je neophodno da bude i vrlo
kompleksan, te je cifra u odnosu na nV40, koji je imao 222 miliona tranzistora,
povećana na 302 miliona – čitavih 80 miliona više. Ovo su približne cifre, ali
je jasno da novi GPU nije mogao biti izrađen u 130-nanometarskom procesu. Na sopstvenim
greškama se najbolje uči, pa su se u kompaniji nVidia, zajedno sa partnerima iz
TSMC-a odlučili za već razrađeni 110-nm proces. U prvi mah, ispostavilo se da
je to ispravan potez, jer se na ATI-jeve R520 i R530 (pa čak i manje kompleksni
RV515), koji su 90-nm čipovi, još uvek čeka. G70 poseduje čak 24 piksel pipeline
jedinice, kao i 8 vertex shader jedinica, što je u odnosu na 16ps / 6vs “konfiguraciju”
kod nV40, kvantitativno unapređenje od 50, odnosno 33%, a tu su, svakako i kvalitativne
dorade – svaki od ovih shader jedinica je ponaosob daleko efikasniji u odnosu
na jedinice iz nV40 procesora. Vertex engine nije unapređen u istoj meri kao Pixel
Shader, što je i logično, s obzirom na trendove u igračkoj industriji. Najavljene
igre će u većoj meri koristiti operacije nad pikselima, nego što će sirov broj
poligona biti povećan. Umesto dodatnih vertex-a, novi modeli će izgledati bogatije
zahvaljujući normal i paralax mapping tehnikama, dok su drugi specijaliteti kao
što su subsurface scattering, HDR (realnije osvetljenje), depth of field, bolja
“kontrola” nad MRT-ovima, te nove tehnike antialiasing-a, čiste pixel operacije.
Ukratko rečeno, G70 je tehnološki moćniji od nV40, ali ne u smislu da će moći
da podrži funkcije koje nV40 ne može (u budućnosti ćemo sve ređe biti svedoci
da jedna kartica ne može da prikaže ono što druga može), već da je u arhitekturalnom
smislu poprilično evoluirala. Uostalom, i na AMD i Intel procesorima rade iste
aplikacije, ali je pitanje koja na kom procesoru radi brže. Imajući ovo u vidu,
nema smisla pričati o tome koliko je G70 napredniji od R480, pa se nadamo da će
se čekanje na R520 isplatiti i za korisnike, ali i za IT, uopšte. Novi GPU je, naravno
i fizički veći od nV40, ali i od R520, pa je sa svojih 333 kvadratna milimetra,
verovatno najveći 110-nm procesor koji se proizvodi za desktop računare (uključujući,
i ovoga puta, podršku za Apple Macintosh). Poređenja radi, Athlon 64 X2 procesor
ima površinu jezgra od oko 200 kvadratnih milimetara, dok R480 ima nešto manje
od 300 kvmm, sa svojih 180 M tranzistora, ali izrađen u 0.13 mikronskom postupku.
nVidia je, kao i ranije, slikovito demonstrirala koliko se “silicijuma” nalazi
unutar G70 procesora.
Bez obzira na broj tranzistora, kao i na činjenicu da je nV40
navodno zahtevao fantastično jako napajanje (a u praksi se pokazalo da to nije
slučaj, bar ne u tolikoj meri) i da se poprilično zagrevao, G70 je, pre svega,
izrađen u 110-nm postupku, a koristi inteligentan sistem koji isključuje delove
GPU-a koji se u tom trenutku ne koriste, što je još jedan razlog zbog čega GeForce
7800GTX “vuče” izuzetno malo “struje” dok radite sa 2D aplikacijama. Naravno,
i same frekvencije su niže tokom rada u 2D režimu, pa sveukupno, GeForce 7800GTX
zahteva manje energije od GeForce 6800 Ultra grafičke kartice, što je zaista
pohvalno. Evo i uporedne tabele u kojoj možete videti neke karakteristike high
end GPU-ova.
NVIDIA
GeForce 7800 GTX (G70)
NVIDIA
GeForce 6800 Ultra (nV40)
ATI
RADEON X850 XT Platinum Edition
Proizvodni proces
0.11
micron
0.13
micron
0.13
micron low-k
Približan broj tranzistora
302
miliona
222
miliona
160
miliona
Frekvencija jezgra
430MHz
400MHz
/ 425MHz PCI-E
520MHz
Memorijski kontroler i tip
memorije
256bit
GDDR3 SDRAM
256bit
GDDR3 SDRAM
256bit
GDDR3 SDRAM
Frekvencija memorije (efekt.)
1200
MHz
1100
MHz
1180
MHz
Propusni opseg memorije, max.
34GB/s
32.8GB/s
33.4GB/s
Memorijska konfiguracija, max.
512MB
512MB
512MB
Interfejs
PCI
Express x16
PCI
Express x16
PCI
Express x16
Pixel Shader ~
Shader model
3.0
3.0
2.x
Static loops / branching
DA
DA
DA
Dynamic loops /branching
DA
DA
NE
Multiple Render Targets
DA
DA
DA
Floating-Point Render Target
DA
DA
DA
Maksimalan broj piksela po
klok ciklusu
24
16
16
Maksimalan broj Z-operacija
po klok ciklusu
32
32
16
Broj teksturnih semplova
16
16
16
Algoritmi za filtriranje
tekstura
Bi-linear
Bi-linear
Bi-linear
tri-linear
tri-linear
tri-linear
anisotropic
anisotropic
anisotropic
tri-linear
+ anisotropic
tri-linear
+ anisotropic
tri-linear
+ anisotropic
Maksimalni nivo anizotropnog
filtriranja
16x
16x
16x
Vertex Shader
~
Shader model
3.0
3.0
2.x
Broj vertex jedinica
8
6
6
Static loops / branching
DA
DA
DA
Dynamic loops / branching
DA
DA
NE
Ucitavanje tekstura iz Vertex
Shadera
DA
DA
NE
Hardverski tesselation
NE
NE
NE
Full-Screen Anti-Aliasing
algoritmi
Ordered-grid
super-sampling
Ordered-grid
super-sampling
Rotated-grid
multi-sampling
Rotated-grid
multi-sampling
Rotated-grid
multi-sampling
temporal
anti-aliasing
super-sampling
+ multi-sampling
super-sampling
+ multi-sampling
transparent
supersampling
Broj FSAA semplova
2..8
2..8
2,4,6
Optimizacione tehnologije
~
Hidden Surface Removal (HSR)
DA
DA
DA
Texture, Z-buffer, kompresija
frame buffer-a
DA
DA
DA
Fast Z-buffer clear
DA
DA
DA
OpenEXR (HDR)
DA
DA
NE
Posveceni Video Engine
DA
DA
NE
NVIDIA® CineFX™
4.0 Shading
Architecture
° Support for Microsoft DirectX 9.0
Vertex Shader 3.0
° Displacement mapping
° Geometry instancing
° Infinite length vertex programs
Pixel Shaders
° Support for DirectX 9.0 Pixel
Shader 3.0
° Full pixel branching support
° Support for Multiple Render Targets
(MRTs)
° Infinite length pixel programs
Next-Generation Texture Engine
° Accelerated texture access
° Up to 16 textures per rendering
pass
° Support for 16-bit floating point
format and 32-bit floating point
format
° Support for non-power of two
textures
° Support for sRGB texture format
for gamma textures
° DirectX and S3TC texture
compression
Full 128-bit studio-quality floating point
precision through the entire rendering
pipeline with native hardware support for
32bpp, 64bpp, and 128bpp rendering
modes
64-Bit Texture Filtering and Blending
Full floating point support throughout
entire pipeline
Floating point filtering improves the
quality of images in motion
Floating point texturing drives new levels
of clarity and image detail
Floating point frame buffer blending gives
detail to special effects like motion blur
and explosions
NVIDIA® Intellisample™ 4.0 Technology
Advanced 16x anisotropic filtering (with
up to 128 Taps)
Blistering-fast antialiasing and
compression performance
Transparent multisampling and
transparent supersampling modes boost
antialiasing quality to new levels
Gamma-adjusted rotated-grid antialiasing
removes jagged edges for incredible
image quality
Support for normal map compression
Support for advanced lossless
compression algorithms for color, texture,
and z-data at even higher resolutions and
frame rates
Fast z-clear
NVIDIA® UltraShadow™ II Technology
Designed to enhance the performance of
shadow-intensive games
NVIDIA® SLI™ Technology
Patented hardware and software
technology allows two GPUs to run in
parallel to scale performance
Scales performance on over 60 top PC
games and applications
NVIDIA® PureVideo™ Technology
Adaptable programmable video processor
High-definition MPEG-2 and WMV9
hardware acceleration
Spatial-temporal de-interlacing
Inverse 2:2 and 3:2 pull-down (Inverse
Telecine)
4-tap horizontal, 5-tap vertical scaling
Overlay color temperature correction
Microsoft® Video Mixing Renderer (VMR)
supports multiple video windows with full
video quality and features in each window
Integrated HDTV output
Composited Desktop Hardware Engine
Video post-processing
Real time desktop compositing
Accelerated antialiased text rendering
Pixel shader driven special effects and
animation technology capability
Advanced Display Functionality
Dual integrated 400MHz RAMDACs for
display resolutions up to and including
2048×1536 at 85Hz
Dual DVO ports for interfacing to external
TMDS transmitters and external TV
encoders
Full NVIDIA® nView® multi-display
technology capability
Advanced Engineering
Designed for PCI Express x16
Designed for high-speed GDDR3 memory
NVIDIA® Digital Vibrance Control™
(DVC) 3.0 Technology
DVC color controls
DVC image sharpening controls
Operating Systems
Windows XP/Windows XP 64
Windows ME
Windows 2000
Linux
Macintosh OS X
API Support
Complete DirectX support, including the
latest version of Microsoft DirectX 9.0
Shader Model 3.0
Full OpenGL support, including OpenGL 2.0
Ako poseduje “samo” 50% više pixel jedinica i poseduje tek dva dodatna
vertex podprocesora, kako nVidia može da tvrdi da je GF 7800GTX dva puta brži
od GF 6800 Ultra u shader operacijama? Pre svega, novi GPU neće biti dva puta,
ali ni 20% brži u situacijama kada je sistemski procesor usko grlo. Kao i ranije,
ATI i nVidia napominju da se kartice porede u najvišim rezolucijama i uz primenjene
antialiasing i anisotropic filtere, što su “situacije” kada grafička kartica pokazuje
svu svoju snagu. Još uvek se, u manje zahtevnim ili dobro optimizovanim igrama
i situacijama kada su CPU, matična ploča i memorija usko grlo, može desiti i da
kartica daje iste rezultate u rezoluciji 1024 x 768 i 1280 x 1024, a nekad čak
i da rezultat bude za neki promil viši u višem modu. Bez obzira na to što je memorijski
propusni opseg samo za nijansu viši u odnosu na GeForce 6800 Ultra, svaki od pixel
i vertex pipeline jedinica doživeli su redizajn, pa su daleko efikasniji. Da ovo
nije samo marketinška priča, pokazaće kasnije i testovi, a do tada ćemo se detaljnije
pozabaviti novinama u okviru G70 jezgra. Evo i izgleda samog G70 jezgra…
Pixel Pipeline
Kao što smo napomenuli, svaki od pixel pipeline jedinica koje su inkorporirane
u G70, pojedinačno su mnogo efikasnije od onih u nV4x čipovima. nVidia zvaničnici
tvrde da je arhitektura G70 GPU-a napisana “od nule”, ali je evidentno da je
ipak nastala unapređenjem nV40 jezgra. Na kraju, PS jedinice u oba procesora
imaju isti skup mogućnosti, a to uključuje maksimalan broj grananja, loop-ova
i drugih specifikacija o kojima smo pisali u prvom testu GeForce 6800 Ultra
kartice, a koji nisu podrazumevani samom podrškom za Shader Model 3.0. Ako nVidia
sada ističe podršku za Longhorn (Windows) Graphic Foundation programsko okruženje
/ interfejs, setimo se da ga je isticala i tokom prezentiranja nV4x baziranih
kartica.
Na shemi možete primetiti da su pixel pipeline jedinice i dalje organizovane
u 2×2 Pipeline formacije, a lepo se vide i vertex shaderi. Svaki Pixel Unit
u okviru Quad jedinice dele iste dedicated bafer memorije, uključujući i Level2
texture cache. Fizički, Quad Pipeline Unit je sastavljen od PS jedinica smeštenih
u jednoj liniji, a ne u kvadratni oblik, a slično su raspoređeni i Vertex Shaderi.
nVidia ističe da je paralelizam i deljenje zadataka dodatno usavršeno, pa jedinice
međusobno daleko bolje “sarađuju”. Podsetićemo, Pixel Shader jedinice zauzimaju
i najveću količinu silicijuma u čipu, ali obavljaju i najbitniji deo posla.
Sve PS jedinice procesiraju isti shader program po SIMD principu (single instruction
/ multiple data), ali pošto je u ovakvim programima dinamički “looping” i “branching”
česta pojava, pri tako širokom deljenju posla, kao kod G70, neki Quad fragmenti
mogu raditi na kalkulacijama koje će na kraju biti nepotrebne, nakon čega moraju
krenuti sa programom od početka. Kada bi postojao, GPU sa 12 identičnih pipeline
jedinica, koje rade na 500 MHz, bili bi u teoriji jednako efikasni kao i 24
PS jedinice na 250 MHz, ali to u praksi nije slučaj, pošto je uz manje deljenje
posla, ceo pipeline daleko efikasniji.
Pixel Shader Unit se sastoji od dve komponente za rad sa vektorima, jedne komponente
za teksturisanje i dve tzv. Mini-ALU (aritmetičko logičke) jedinice, specijalizovane
za posebne karakteristične operacije, koje rade zajedno sa glavnim ALU jedinicama.
Ove M-ALU jedinice su bile prisutne i kod nV40 procesora, a njihov zadatak je
adresiranje tekstura u istom kloku u kome glavni ALU radi sa multiple/add (MADD)
operacijama. Ujedno, ovo je jedan od razloga zbog koga je pipeline engine u okviru
nV4x procesora bio toliko efikasniji od onog kod nV3x generacije. Uz sve to, sam
Pixel Shader “unutar” G70 je daleko efikasniji pri kalkulaciji tipičnih shader
algoritama. nVidia navodi da su njihovi programeri kreirali shader kako bi bio
efikasniji u radu sa najčešće korištenim algoritmima, a sve na osnovu analize
preko 1300 algoritama. Nova Pixel Shader jedinica je sposobna da završi između
dva i tri puta više MADD operacija po kloku u odnosu na PS iz nV40 procesora.
Dve ALU jedinice, dakle, ne obavljaju isti deo posla, već su manje-više specijalizovane
za tipične kalkulacije, što, u zavisnosti od tipa shader programa, dozvoljava
bolju podelu posla između Quad Pipe jedinica, odnosno veću nezavisnost. Performanse
celog pipelinea, svakako, ne zavise samo od brzine izvršavanja MADD operacija,
međutim, efikasnost ove jedinice je svakako i sigurno daleko veća nego ranije.
Pored ovih promena u arhitekturi, G70 je doneo unapređenja i na drugim poljima,
kao što su bolja kompresija podataka koji se šalju kroz memorijski kontroler,
rad sa baferima različitih nivoa, early Z-test i lociranje “nevidljivih” površina
itd.
Arhitektura Unificiranih Shadera, kakvu je ATI najavio za Xbox360 GPU, je bila
“u igri” i za G70, ali se nVidia odlučila da to ostavi za neku od narednih generacija.
Na prvom mestu, aktuelan softver, ali i sam Direct3D API su koncipirani tako da
je još uvek moguće odrediti najbolji balans između vertex i pixel operacija, te
tako kreirati GPU koji će biti efikasan u 3D aplikacijama koje će biti u upotrebi
u narednom periodu. Unified Shader Architecture podrazumeva da Shader jedinice
imaju iste aritmetičke mogućnosti, te bi i jedinice koje rade Vertex procesiranje
bile nepotrebno kompleksne, što bi dovelo do dodatnog povećanja količine neophodnog
“silicijuma”. Tek kada API i programeri budu tražili GPU sa visokim nivoom programabilnosti
(u ovom trenutku je možda bolje koristiti termin “univerzalnost”), sa aspekta
ukupnih performansi i konkretne ekonomije, biće dovoljno isplativo kreirati video
procesor sa arhitekturom unificiranih shader jedinica.
ROP (raster operacije) izvršavaju kolor i Z kompresije, prenose informacije o
finalnoj boji piksela u frejm bafer, vrše blending FP16 RT (render target), te
konverzije i manipulacije scene (ako je uključen multisampling AA). ROP pipeline
“segment” se u odnosu na onaj kod nV40 nije mnogo promenio, pa je sposoban za
maksimalno 4 multi-sampling operacije (u rotated-grid “modu”) – supersampling
i dalje ne podržava rad sa alpha blending format RT, o čemu ćemo pričati nešto
kasnije. U prilogu su slike koje pokazuju specijalitet Pixel Shader 3.0 engine-a.
Poređenje standardnog SM1.1 bump mapping sa SM3.0
paralax mapping tehnikom (Splinter Cell 3)
Poređenje standardnog SM1.1 lightning modela sa
SM3.0 lightning modelom sa HDR-om (Splinter Cell 3)
Izmena Pixel Shader Pipeline-a je olakšala posao piscima drajvera, koji su u vreme
kada su nV3x, pa čak i nV4x bile najaktuelniji akceleratori, morali da se igraju
sa kodom i u same drajvere upisuju odgovarajuće, prepravljene, tipske shader programe,
koji bi menjali postojeće. Ovaj postupak, poznat kao Shader Replacement (Shader
Look-Up table), nVidia je koristila veoma intenzivno u vreme kada je GeForce FX5900
sa sporijim derivatima, bio udarna tehnologija. Kasnije, čak je i konkurent ATI
radio slične stvari u igrama u kojima je njihov akcelerator bio inferioran (ko
je pomenuo Doom III?). Poenta ovog “mini uvoda” je u tome da je i zameni shader
programa došao kraj; da postoje posebni drajveri za GeForce 7, bili bi znatno
manji nego unificirani ForceWare, koji i dalje poseduje skup shadera za zamenu
u radu sa starijim video karticama. Izmene u arhitekturi su bile usmerene upravo
ka boljem radu sa već prihvaćenim tipom HLSL kompajlera, a to znači efikasniji
rad i direktniji pristup samom hardveru, uz manje posredovanja raznih zamena i
prevodioca.
Vertex Pipeline
Na dijagramu sa prethodne strane, mogli smo da vidimo da G70 dolazi sa osam
Vertex Shader jedinica. Po broju tranzistora i kompleksnosti, ove jedinice su
manje od Pixel Shader jedinica. Kao što znamo, one obavljaju kalkulacije vezane
za geometriju 3D scene, pa podaci koje GPU traže “prolaze” prvo kroz ovaj deo
Pipeline-a. Kao i sa nV40, drajver može da prebaci deo posla koji obavlja Vertex
Shader na sistemski procesor (kroz HAL ugrađen u Direct3D), mada se to dešava
jako retko ili nikada, s obzirom na to da su današnje igre, a pogotovo one u
najavi, više pixel nego vertex intenzivne. I VS je pretrpeo poboljšanja – nVidia
tvrdi da MADD operacija sada “traje” samo jedan klok ciklus, a da se skalarne
operacije obavljaju do 30% brže, pod istim uslovima, u odnosu na one kod nV40
GPU-a. Ostatak Vertex Pipeline-a je bezmalo preuzet od prethodne generacije.
Princip rada je isti – organizacija je MIMD tipa (Multiple Instruction / Multiple
Data), a VS jedinica se sastoji od Vektorskog i Skalarnog aritmetičkog procesora.
S obzirom na organizaciju i jednostavnost operacija koje se izvode, podela posla
je besprekorna, pa nema situacija u kojoj neka jedinica može da radi na delu
shader programa koji neće biti upotrebljen. Vertex Fetch segment unutar svake
od VS jedinica ima mogućnost da prosledi maksimalno četiri teksturna sempla,
direktno u Pixel Shader Unit, kako bi se minimizovala latencija pri pristupu
podacima koji su, u pipelineu, na redu za dalje procesiranje.
CineFX 4.0 arhitektura je donela mnogo unapređenja i boljitaka, međutim, realno,
oni nisu toliko koliko u kompaniji ističu. nVidia, ipak, nije mogla da navede
neke novitete vezane za memorijski kontroler jer je on i dalje crossbar tipa,
sastavljen od četiri 64-bitne komponente koje ukupno daju 256-bitni “put” ka
GDDR3 memoriji. O njemu smo već detaljnije pisali u testovima prethodnih high-end
kartica ovog proizvođača. Unapređenje se svodi na povećanje radnog takta sa
1100 na 1200 MHz. I ovo je, na neki, način, potvrda da u kompaniji nVidia razmišljaju
prema trendu koji je aktuelan i koji se nazire – igre će biti pixel intenzivne,
bez prevelikog opterećenja na memorijski kontroler. Ipak, manji ukupni memorijski
propusni opseg onemogućava da G70 pokaže šta može kada su u pitanju performanse
pri Transparent AA i visokim nivoima AF filtera. Na kraju krajeva, to nije bio
izbor koji je ultimativno nVidia izabrala – u ovom trenutku ne postoji memorija
brža od poznatih Samsung GDDR3 1.6ns čipova, bar ne u većim količinama. Iako
još uvek nema igara koje će umeti da iskoriste 512 MB Video RAM memorije, trend
je takav da će u upotrebi uskoro biti veće količine normal i displacement mapa,
poneka volumetric tekstura, dok su MRT i FP32 teksture takođe memorijski zahtevne.
G70 ima dovoljno snage da se izbori sa 3D scenama koje u sebi sadrže više od
256 MB ovakvog “materijala”, pa će ovo biti i generacija kojoj bi dodatna memorija
mogla dosta da znači.
Transparency AA
Jedna od retkih novih mogućnosti G70 procesora je podrška za transparentni
antialiasing. Najveći problem klasičnih Multisample antialiasing algoritama
je u tome što ne mogu da se “izbore” sa nazubljenim ivicama kroz celu teksturu,
na samom poligonu, već samo na ivicama objekata. GeForce 7800GTX poseduje transparentni
AA koji može da “ispegla” i ivice na transparentnim teksturama. Kada ovu funkciju
primenite u samom drajveru (po defaultu je, naravno, isključena), teksture koje
imaju alpha kanale bivaju specijalno tretirane, pa tako cveće, trava, vegetacija
i teksture ograde bivaju tretirane kao da je u pitanju “prava geometrija” a
ne samo trik-tekstura na jednoj ravni. Zamislite sada igru FarCry, koja pored
HDR-a ima novu šansu da izgleda realnije i lepše. Transparentni antialiasing
radi sa oba algoritma – Multi i Supersempling-om, ali dok je MSAA manje zahtevan
i efektan, SSAA pruža viši kvalitet učinka. Takođe, nVidia je konačno dodala
korekciju gamme kada se primeni AA, tako što je podržala gamma-korigovano utapanje
(antialiasing se upravo realizuje multiple blending-om). Primer lepo možete
videti na priloženim slikama, a mi smo karticu, osim sa standardnim AA algoritmima,
testirali i u MSAA i SSAA modovima – tabele ćemo prikazati na narednim stranama.
kliknite na slike da bi ste ih uvećali i videli
razliku
HDR
High Dynamic Range je relativno svež i neverovatno upečatljiv “feature” preuzet
od softverskih render mašina. ATI je, zapravo, bio prvi koji je ponudio neku
vrstu HDR “osvetljenja”, mada je svaki način prezentovanja istog na monitoru
kakav poznajemo praktično nemoguć. HDR na dekstop sistemima podrazumeva manipulaciju
vrednostima za boju iznad standardnog opsega, kako bi se kreirao privid da su
neke površine jače osvetljene. Jedini način da pikseli budu mnogo svetliji jeste
da se proračuna u kojoj meri i kako to na najbolji način reprezentovati na SDR
(Standard Definition Range) mediju kakav je standardni monitor (CRT ili TFT
sa RGB 0..255 DR-om), a sve bez uticaja na “ostatak scene”. Stariji softver
(igre) podrazumeva odvajanje svega 8-bita za nivoe osvetljenosti piksela, što
znači da je maksimum 256 ovakvih nivoa. G70, kao i nV40, manipuliše sa 64-bit
FP filtering i blending operacijama nad FP16 i FP32 teksturama (16-bitna FP
preciznost po kolornom kanalu (RGBA), odnosno 64-bit FP preciznost po pikselu).
U softverskom rendering-u, koji se primenjuje i u Holivudu, HDR podrazumeva
daleko sofisticiraniji pristup obradi scene – rad sa daleko većom preciznošću,
kako bi krajnji efekat bio fotorealizam. Na svu sreću, sve i na monitorima i
u igrama izgleda dovoljno ubedljivo, zahvaljujući već poznatoj Tone Mapping
funkciji, koja ima ulogu da konvertuje HDR slike u LDR format, pa je HDR jedna
od novih “fancy” opcija kojom su se prvo hvalili kreatori igre FarCry, dok je
ona danas obavezna u svim visokobudžetnim naslovima i nije izostavljena niti
u jednom tek najavljenom naslovu za SonyPlaystation 3 i Microsoft Xbox360.
Podrška za HDR u okviru G70 nije menjana – i dalje je podrazumevana manipulacija
FP16 teksturama i frejmbafer blending operacije. Međutim, kako su same FP16
teksturne operacije značajno ubrzane (o čemu smo pisali), GeForce 7800GTX radi
sa HDR “opcijom” uz znatno manji pad performansi nego što je to bio slučaj kod
nV40 kartica. Pixel Shader engine je sposoban za trilinearni filtering i maksimalno
16x anisotropic operacije sa FP16 teksturama, ali je antialiasing i dalje ograničen
kada je multisampling AA nad ovakvim teksturama u pitanju.
primer HDR osvetljenja u showcase demou trece
generacije EPIC-ovog engine-a Unreal
Pure Video
nVidia je, na prezentaciji nV40 procesora dosta hvalila posvećeni video procesor
(navođeno je da se on sam sastoji od više tranzistora nego što ukupno ima GeForce
256 GPU), koji je na kraju radio lošije nego onaj kod Radeon GPU-ova, o kojima
sam ATI nije (mnogo) ni pričao. Navodno, Video procesor je bio sposoban da enkoduje
video visoke definicije, bio u pitanju MPEG2, H.264 ili WMV9 format. Nešto kasnije,
nVidia je ponudila bolje drajvere koji su popravili utisak (kada je opterećenje
sistemskog procesora pri dekodovanju 1080p videa u pitanju), mada je evidentno
da je na nV40 karticama problem ostao nerešen, dok je na novijim GPU-ovima,
uključujući i nV45, cela stvar dovedena na mesto. Međutim, tek uz G70, ovaj
video engine je dobio i novi marketinški naziv – PureVideo, a njegove mogućnosti
su sledeće:
• High-definition MPEG-2 hardware acceleration. A dedicated
16-way vector processor enables smooth playback of HD video with minimal CPU
usage.
• High-definition WMV hardware acceleration. Programmable support of the newest
format enabled by Microsoft Windows Media Player and Windows XP Media Center
Edition 2005 for fluid playback of WMV and WMV HD content.
• High-quality real-time video recording. An advanced motion-estimation engine
makes it possible to record in real-time without a loss in quality.
• Spatial/temporal adaptive de-interlacing. Reproduces interlaced content from
satellite, cable, and DVD feeds in full detail and without jagged edges or artifacts.
• 3:2 pull-down correction and “bad edit” correction (only on GeForce 6800 and
GeForce 6600 GPUs). Restores video to its original 24fps film format.
• Flicker-free multi-stream scaling. High-quality 4-tap by 5-tap scaling maintains
image detail, even when scaling a small video to a large area of the screen.
• Display gamma correction. Automatic format detection adjusts the color quality
of video playback so that it is not too dark, overly bright or washed out, regardless
of the display.
Zanimljiva činjenica vezana za PureVideo engine je to što se Pixel Shader
engine koristi za processing video signala, tako što se svaki frejm jednostavno
tretira kao tekstura, dok video engine daje instrukcije samom PS pipeline-u
kakve operacije bi trebalo izvršiti nad njima.
* * *
ForceWare 75 serija drajvera je takođe doživela brojna unapređenja, od kojih
većina postaje dostupna ako imate GeForce 7800GTX (gamma corrected / transparency
anti-aliasing su samo neke od njih). No, još neki od noviteta je daleko veći
broj profila za SLI mod, kao i bolja kontrola nad SFR i AFR režimima rada. Profile
je sada moguće kreirati bez posebnog editovanja .ini fajlova, ali i downloadovati
sa nVidia sajta. Srećnici koji poseduju LCD ili plazma ekrane visoke definicije,
osim fantastičnog de-interlacing algoritma u 1080i formatu, sada na raspolaganju
imaju detekciju i korekciju inverse 2:2 (pulldown) kao i kompletnu podršku za
COPP i HDCP. Novitet kakav nismo očekivali naziva se “Smart Dimmer” i tu je
da bi smanjio osvetljenje LCD monitora na prenosnim računarima koji nemaju pametan
power management softver. nVidia je čak najavila i mogućnost uključivanja SLI
moda bez potrebe za restartovanjem operativnog sistema, kao i auto-testiranje
SLI modova u igrama koje ga po profilu ne podržavaju – za ForceWare 80 seriju
drajvera.
Novi technology demoi
Mad Mod Mike Technology Demo
Mad Mod Mike je simpatični debeljko opsednut modovanjem hardvera dece koja spavaju
(??!). Ok, ima li još takvih na našem forumu?! 🙂 U Mad Mod Mike tehnology demou,
Majk (hm) se ušunja u sobu igrača kome su potrebne više performanse i onda im
apgrejduje mašinu (ona priča sa čuvarima kapija i ribom koja lebdi mi je delovala
realnije – prim. aut.), posebno grafičku karticu, koja je uvek, naravno neki
GeForce. Ne samo što upgrade-uje, on sve i volt-moduje, menja i optimizuje…
sa alatom koji liči na one koji koriste serviseri auspuha. Šalu na stranu, našeg
Majka, osim dobrodušnosti, čine Pixel Shader programi verzije 3.0, te Radiant
Lightning omogućava najrealističnija osvetljavanja svih površina sa “holivudskom
preciznošću”, u šta nam nije bilo teško da poverujemo. Tu je i ambijentalna
svetlost, te Majkova odeća i kapica primaju svetlost koja se reflektuje sa drugih
objekata. Kompletan vizuelni užitak, zajedno sa najnaprednijom i najpreciznijom
vrstom Depth of Field efekta!
MSI NX 7800GTX
MSI je i ovoga puta prvi na našem testu sa novom GeForce tehnologijom – bilo
bi isuviše da se vratimo unazad i brojimo koji je to put po redu. Ovo ćemo ponoviti
više puta: ne samo da je kartica stigla na Benchmark test, već se istoga dana
(početak jula) našla u maloprodaji u dilerskoj mreži distributerskih kuća sa
kojima MSI sarađuje. Paket nije prevelik – ni blizu dimenzija onog za GeForce
6800 Ultra; kao da su se MSI, Leadtek i Gigabyte utrkivali ko će više kartona
potrošiti na ambalažu. Ono što ne liči na MSI, je pomalo skroman bundle: jedan
CD i jedna (ali vredna) igra: The Chronicles of Riddick. Naravno, tu su HDTV
/ VIVO razdelni kabl, S-Video kabl, “šestopinski u molex” konvertor, dva DVI
adaptera i uputstva. Ali, kad je GeForce 7800GTX u pitanju, sasvim dovoljno.
Sva elektronika je spakovana na PCB poprilične dužine… nadmašeni su Radeon
X850 XT, ali i GeForce 6800 Ultra, pa čak i do sada najduža kartica ATI Radeon
X800 XL AGP sa R430 GPU-om (koji ima velik PCB zbog Rialto PCI-E to AGP “prevodioca”),
nadmašena (dimenzije su 205 x 100 mm). Primećujemo single-slot rashladni sistem,
dok je raspored komponenti prepoznatljiv i podseća na GeForce 6800 Ultra kartice
od, recimo, ASUS-a (koji je još pre godinu dana imao single-slot heat-pipe kuler).
NX 7800GTX, kakva je oznaka MSI kartice, poseduje 2 DVI-I konektora i Video
in & out mogućnosti, što je u nomenklaturi ove kompanije, u skraćenom obliku
– VT2D256E. Najvećim delom kartice, kao što vidite, dominira aluminijumski hladnjak
sa heat pipe tehnologijom, koji prekriva i GPU i memorijske module. Na kartici
uočavamo samo tri elektrolitska kondenzatora, pa je jasno da je ostatak kondenzatora
drugog tipa (polipropilenski, polistirenski dielektrički – što se može videti
na PCB-u). Mosfeti su i ovog puta hlađeni manjim aluminijumskim profilom, a
uočavamo i dosta filter čipova.
S obzirom na to da je hladnjak na kartici masivan, sa druge strane štampe je
osiguran pravim šrafovima, a ne metalnim tiplovima kako je to do skora bio slučaj.
Iako kartica ima standardnih 256 MB memorije, osam GDDR3 čipova su smešteni
po četiri sa obe strane, kako bi se smanjilo zagrevanje sa osnovne strane štampe.
Generalno, PCB je “spreman” da svih 256 MB memorije mogu da se spakuju sa jedne,
a dodatnih 256 MB sa druge strane, te ne sumnjamo da će biti predstavljena i
verzija kartice sa 512 MB VRAM-a (GeForce 7800 Ultra, verovatno i na višim frekvencijama).
MSI NX 7800GTX, kao kompletno referentna kartica, koristi iste GDDR3 Samsung
BGA memorijske čipove od 1.6 ns, kao i GeForce 6800 Ultra, ali i X850 XT, X800
XT i mnoge druge kartice (uključujući i neka izdanja GF 6600GT modela, kad smo
već kod toga). Ne sumnjamo, naravno, da se za najjače kartice biraju specijalne
serije, pa nije čudno što su već najavljena specijalna izdanja GF 7800GTX kartice,
kakav bi trebalo da ponudi Gainward (vodeno hlađenje i frekvencije od 475 /
1400 MHz). Čipovi su raspoređeni “u krug” oko GPU-a, što nVidia praktikuje još
od modela FX5900 Ultra, radi boljeg integriteta signala.
Sam GPU je, kao što smo pominjali, površinski najveći do sada, bez obzira
što je korišten 0.11 micron proces. Možemo očekivati da će i R520 biti sličnih
dimenzija, iako očekujemo da ima veći broj tranzistora, ali, podsećamo, biće
izrađen u 90-nm postupku. Referentni sistem hlađenja je najsličniji nekim rešenjima
partnera iz bliske prošlosti ili onom koji je kompanija predvidela za GeForce
6800GT. Sastoji se od dva odvojena aluminijumska profila koja sa donje strane
preuzimaju toplotu, a kroz listiće, smeštene sa gornje strane, prolazi hladan
vazduh koji uvlači ventilator (primetili smo da su na slikama koje smo preuzeli
sa nVidia ftp-a, ovi profili načinjeni od bakra, dok na sempl, ali i na MSI
kartici, to nije slučaj). Toplota bolje se distribuira i raspoređuje u sve delove
i zahvaljujući toplotnoj cevi u obliku slova U. Vrlo važno je odvesti toplotnu
enegriju sa dela profila koji pokriva GPU, ali i memoriju. Ceo sistem je spakovan
u atraktivno kućište, sa maskom koja otkriva samo deo unutrašnjosti u obliku
logoa kompanije. Partnerima se ostavlja da ceo sistem zamene nekim drugim ili
ulepšaju postojeći raznim diodama i drugim sitnicama, ali je činjenica da će
hlađenje u kasnijem periodu biti manje važno kada izađu G70 sa “upeglanijih”
vafera.
MSI NX 7800GTX je, kao i referentni model, podešen na 430 MHz za core i 600,
odnosno efektivnih 1200 MHz, na koliko radi memorija. Memorijska magistrala
je, naravno, 256-bitna, a kao i što smo očekivali, nova kartica ima i VIVO mogućnosti,
koje obavlja novi Philips-ov koder čip SAA7115HL. Memorijski čipovi su deklarisani
na 1250 MHz, ali s obzirom da su već dve godine u proizvodnji, dobar broj primeraka,
uz dobro hlađenje, dostiže i „magičnih“1400 MHz. NX 7800GTX ima S-Video konektor,
na koji se „vezuje“ HDTV izlaz i video ulaz. Sa druge strane štampe uočavamo
heat-spreader, koji služi i da bi se kuler sa osnovne strane pričvrstio i imao
bolji kontakt sa komponentama.
Moramo reći da je kartica ipak predugačka, pa smatramo da će biti i redizajna
ove štampane ploče, možda u poslednjem kvartalu, ali realnije početkom naredne
godine. Kuler nije bučan, osim kada se sistem butuje, na šta smo već navikli
(kartica tada testira da li je napajanje dovoljno jako da izdrži “Heavy GPU
Load” situacije). Pomenimo još jednom da se ova kartica već nalazi u prodaji,
što je fantastičan potez od strane nVidie i nešto na šta ATI mora da odgovori.
Ovo je jedna od retkih situacija da nam je prvi primerak stigao direktno iz
prodaje, a ne od samog proizvođača ili samog dizajnera GPU-ova. Prikazuje veoma
oštru sliku, bez obzira na upotrebu adaptera, a o stabilnosti u radu ne treba
mnogo govoriti, pošto je besprekorna.
Test Setup
PCI Express kartice smo testirali na test sistemu prikazanom
u tabeli:
Procesor
AMD Athlon 64 3500+ @ 2600 MHz (260 x
10)
Matična
ploča
MSI K8N Platinum SLI
nVidia nForce 4 SLI
HTT 4 x 260 MHz
Memorija
2 x 512 MB Corsair TwinX
PC4400CL25 (Samsung TCCD) @ 260 MHz (2.5-3-3-8)
Hard
Disk
Western Digital Caviar
200 GB ATA133 (2000JB)
Video
Karte
ATI Radeon X850 XT Platinum Edition – 256 MB GDDR3 – Catalyst 5.4
ATI Radeon X800 XL – 256 MB GDDR3 – Catalyst 5.4
ATI Radeon X800 XL – 256 MB GDDR3 – Catalyst 5.4
Monitor
Samsung
SyncMaster 959NF
Cooling
CoolerMaster Hyper 6
DVD
uređaj
Pioneer DVR-108D
CDRW
uređaj
Pioneer DVR-106S
Operativni
sistem
Windows
XP Service Pack 2 with XPLite! (optimized for performance)
Direct X 9.0c
Igre/Bench
programi
FutureMark 3D Mark 03 340
FutureMark 3D Mark 2005
iD Software Doom 3
Microsoft Halo for PC
Aquamark 3 Commercial Plus
Activision Call of Duty: United Offensive
Valve’s Counter Strike: Source
Valve’s Half Life 2
Splinter Cell: Chaos Theory
Crytek FarCry v1.31
ColinMcRae 4
CodeCreatures Benchmark Demo
SpecORG ViewSPEC Perf 8.1
X2 – The Threat Rolling Demo Benchmark
Painkiller retail
Prince of Persia: Sands of Time Retail
The Chronicles of Riddick Retail
EPIC Unreal Tournament 2004 Demo
Kako smo testirali ?
Radeon kartice smo testirali sa default opcijama, ali sa isključenim Catalyst
A.I. koji je po default-u primenjen u drajverima. Trilinearne optimizacije su
ostale uključene, a anisotropic isključene. Geometric Instancing je uključen pomoću
ATI Tray Tools softvera. Pokušali smo da utvrdimo da li sa sadašnjim najzahtevnijim
igrama možemo da simuliramo situaciju u kojoj će se grafički akceleratori naći
u radu sa igrama sledeće generacije. Zbog toga smo neke od naslova, pored standardnih
modova, pokrenuli i uz primenjeni anisotropic filtering (16x) i četvorostruki
full-screen antialiasing, pa nema standardnog dela testa "zahtevni modovi"
pošto su AF + AA tabele date na standardnim stranama.
Sintetički benchmark programi ~ 3DMark 03 – #340
3DMark benchmark program iz 2003. godine, iako kritikovan od strane mnogih, pokazao
je i da proizvodjači moraju voditi računa o brzini izvršavanja Shader programa,
te da je veoma zdravo ispoštovati do kraja DirectX 9 specifikaciju, odnosno napisati
sopstveni kompajler da što bolje sarađuje sa HLSL prevodiocem Microsoftovog API-ja.
3DMark03 je patch-ovan najnovijom zakrpom, a testirali smo na default setovanjima.
Odmah možemo primetiti koliko je brz novi akcelerator – za ATI-jevog šampiona,
Radeon X850XT PE se ne može reci da je odmah iza, ali u odnosu na njega, za GeForce
6800 Ultra, može…
3DMark05
Novo izdanje 3Dmark benchmarka može da se izvršava samo sa Direct X 9 kompatibilnim
akceleratorima. Sva tri testa koriste Shader Model verzije 2.0, 2.0a, 2.0b ili
3.0 – u zavisnosti od podrške koju GPU ima (Radeon 9700 do X800 modela podržavaju
SM 2.0 i 2.0b, dok nVidia FX akceleratori podržavaju verziju 2.0 i 2.0a, a GeForce
7800GTX, kao i GF serije 6, podržava SM 2.0, 2.0a i 3.0). Sva tri game demoa su
izuzetno zahtevni, karakteriše ih jezivo visok broj poligona koji opterećuje VS
jedinicu, kompleksni shader programi (mapiranje neravnina, osvetljenja, emulacija
HDR, particle efekti, dinamične i meke senke, subface scattering, napredni fog
efekti (emulacija volumetric efekta), ali i dosta postprocesing efekata. Najjače
kartice danas isporučuju od 15 do 20 frejmova u većini scena, a na najzahtevnijim
delovima i manje!
Pogledajte samo poslednju rezoluciju, u kojoj se dobro vidi sva snaga novog akceleratora.
Pad performansi Radeon X850 XT i GF 6800 Ultra kartice sa porastom rezolucije
je mnogo veci u odnosu na 7800GTX, koji ima približno visok memorijski propusni
opseg.
AquaMark Commercial Plus
Ovaj benchmark program karakterističan jepo velikom broju opcija za testiranje
mogućnosti Direct X 7, 8 i 9 kompatibilnih video kartica. Koristili smo maksimalan
nivo detalja, test se izvršava bez zvuka, a anisotropic i antialiasing filteri
su bili isključeni. Nismo dali ukupan rezultat već prosečan frame rate po rezoluciji.
Aquamark3 je u ovom slucaju isuviše ogranicen performansama sistema, pa smo se
odlucili da probamo zahtevniji mod…
…i naravno, GeForce 7800GTX je pokazao svu snagu. Zaista nas je iznenadio i
mali pad performansi kod Radeon X850XT PE kartice, te je moguce da je neka od
"optimizacija" u drajverima i dalje ostala aktivna.
CodeCult Codecreatures Standard Benchmark
I dalje vrlo lep i zahtevan benchmark program koji koristimo je CodeCreatures.
Baziran je na engine-u koji koristi Shadere verzije 1.3 (Direct X 8), i odlično
ukazuje na to kako se kartica snalazi sa teksturama veoma visoke rezolucije i
velikom količinom poligona. Vizuelna atraktivnost i fotorealističnost su i po
današnjim standardima na visokom nivou, ali je igra Far Cry definitivno za klasu
nadmašila ovaj test, barem u vizuelnom aspektu. Default test se izvršava u tri
rezolucije: 1024×768, 1280×1024 i 1600×1200. Moguće je kreirati batch u kome je
ćete izabrati sopstvene modove od rezolucija 640*480 do najvišeg grafičkog moda
koji kartica podržava.
Iako napravljen pre više od dve godine, ovaj zahtevni test jednostavno ne dozvoljava
visoke rezultate. Podsetimo se i da su tadašnji high-end akceleratori (GeForce
3 Ti500, ali i GF4 Ti4600) davali od 8 do 12 frejmova u najnižoj rezoluciji, ali
je i dalje pravo cudo da nijedan akcelerator nije dostigao niti se približio barijeri
od 100 fps.
SpecORG SpecView Perf 8.01
Mi smo koristili smo poslednju aktuelnu verziju koji se sastoji od čak osam celina.
SpecviewPerf meri performanse sistema pod OpenGL API-jem tako što simulira osam
standardnih industrijskih aplikacija. 3Dsmax-03 je bayiran na SPECapc za 3dS MAX
u OpenGL okruženju. U sceni su tri modela sastavljena od po približno 1.5 miliona
vertices-a, a testiranje se vrši uz nekoliko tipičnih tipova osvetljenja. Catia-01
je bazirana na Dassault CATIA inžinjering aplikaciji u kojoj modeli imaju do dva
miliona osnovnih linija. Ensight-01 je simulacija CEI EnSight inžinjering aplikacije
koja se koristi za vizuelizaciju. U test su ubačeni displej-list i fast preview
modovi rada. Light-07 je baziran na Discreet-ovoj Lightscape aplikaciji koja koristi
realtime radiosity senčenje. Maya-01, kako joj i samo ime govori, simulira radno
okruženje paketa kompanije Alias – Maya 5, nezamenljivi alat filmadžija u Holivudu.
Proe-03 je baziran na SPECapc okruženju za Pro-Engineer 2001, koji u sceni primenjuje
dva modela u tri shade moda (senčeni, wireframe i hidden-line removal). SW-01
simulira Solidworks 2004 aplikaciju, koju izdaje Dassault Systems i konačno, test
Ugs-04, baziran na SPECapc Unigraphics V17 aplikaciji (odnosno simulaciji iste),
u kojem je prikazan model motora sastavljen od preko četiri miliona osnovnih linija.
nVidia i dalje predstavlja bolji izbor ako radite u CAD i CAM aplikacijama – simulacije
odredjenih softverskih paketa su u ovim situacijama donekle i reprezentativne.
Real Gaming testovi / OpenGL ~ Call of Duty United Offensive
Call of Duty je odlična single i multiplayer igra, bazirana na žestoko modifikovanom
Quake III engine-u, a United Offensive donosi i niz dodataka kada je grafika u
pitanju, pa je tako i zahtevnija. I ovoga puta, podešavanja su bila na apsolutnom
maksimumu.
Nema iznenadjenja, Quake III engine, u kom god da je izdanju, jednostavno više
voli nVidia kartice. Bar dok ne izadju Catalyst upravljacki programi sledece generacije,
sa drugacijom implementacijom OpenGL API-ja, što ce se uskoro desiti.
Doom 3
Doom 3 testiramo sa ugrađenim Demo1 demo-om, na high podešavanjima (highest je
predviđen za kartice sa 512 MB memorije), što podrazumeva da je zvuk isključen,
svi detalji na maksimumu (sve senke, poligoni i najveće teksture), ali i da je
uključeno osmostruko anizotropno filtriranje. Dodat je i UltraHighQuality.pk4,
koji omogućava da objekti bacaju senku sami na sebe (tzv. self-shadow). Zvuk,
AI i fizika su isključeni automatski, samim pokretanjem timedemo komande.
Nismo ni sumnjali da ce poredak biti ovakav…
U još zahtevnijem modu, takodje nema nikakvih iznenadjenja!
The Chronicles of Riddick
I jedna bonus igra, veliki hit, koji stiže uz MSI video kartice… Bazirana je
na OpenGL API-ju, a koristili smo najviša setovanja (PS3.0 na GeForce karticama),
dostupna iz same igre.
Nije ni cudo što MSI ne poklanja ovu igru uz RX seriju kartica – nVidia i dalje
daleko bolja u primenjenom OpenGL okruženju…
Splinter Cell Chaos Theory
Ova igra koristi najnoviju dostupnu verziju Unreal engine-a i u mnogo većoj meri
se oslanja na upotrebu shadera. Karakteriše je veliki broj poligona, ali i funkcije
kao što su HDR, paralax mapping, klasican bump mapping i veliki broj normal tekstura
(tu su i stancil efekti, dosta post processing filtera itd.). Testirali smo na
najvišim mogućim setovanjima, kao i uvek. HDR je, za razliku od SM3.0 moda na
GeForce karticama bio iskljucen.
Naravno, Radeon X850 XT PE odnosi pobedu nad GeForce 6800 Ultra karticom iz razloga
što koristi standardni Shader Model 1.1 path, dok GeForce 6 i 7 rade u punom SM3.0
modu. Lepo se vidi koliko novi akcelerator sve te shader programe nekako brže
"prosledjuje" na monitor.
Colin McRae 04
Naš testbed je svakako zaslužio da mu se pridruži i jedna popularna simulacija
reli vožnje. Ubedljivo najpopularnija i na ovim prostorima, jeste nova inkarnacija
Colin McRae relija. Iako nije napredovala od prethodne, barem u čisto tehničkom
aspektu, ova odlična igra je reprezentativan primer svog žanra, pa će mnoge zanimati
kako se ponašaju novi video akceleratori u jednom ovakvom naslovu.
Jel neko pomenuo limitiranost sistemskim procesorem? Šteta je što smo imali problema
sa ovom igrom i u AA i AF modovima…
Kao dodatni bonus, ubacili smo igru Painkiller: Battle Out of Hell
X2 – The Threat
X2 – The Threat je igra koja je nedavno izašla i privukla pažnju raskošnom grafikom,
karakteristična po detaljnim teksturama, svetlosnim efektima i particle efektima.
Koristi Direct X 8.1, iako inicijalno zahteva instaliranje verzije 9.0. Za testiranje
nismo koristili retail verziju već rolling benchmark demo, mada i prava verzija
ima benchmark mod. Grafika je bila podešena na maksimum, a zvuk isključen.
GeForce 7800GTX pokazuje preko 30% ubrzanja u najvišoj rezoluciji, i to u modu
bez AA i AF filtera. Veoma lepo!
Prince of Persia: Sands of Time
Igra koja je pre godinu dana oduševila gaming community širom sveta: inventivan
gameplay, potezi, jako simpatična Direct X 9 grafika sa skalabilnim engine-om,
sposobnim da radi i u Direct X 8.1, 8.0 i 7.0 modu. Tokom testiranja smo se služili
sa aplikacijom Fraps.
Ovoga puta smo još jednom isprobali i Unreal Tournament 2004
Demo…
Halo: Combat Evolved
Igra zbog koje su mnogi pre tri godine kupili X-Box konzolu, fenomenalni Halo
u verziji za PC je optimizovan za Direct X 9 kartice. Program koristi Pixel Shadere
verzije 2.0. Ovi programi se mogu izvršavati i preko starijih verzija Pixel Shadera,
ali smo mi koristili DX9 mod, najveći broj detalja i trilinearni mod filtriranja.
Far Cry v1.3
Igra koja je po mnogima redefinisala žanr, odnosno pooštrila kriterijume kada
su vizuelni aspekt, ali i gameplay u pitanju. CryTek-ov engine je demonstracija
mogućnosti Direct X 9 API-ja u praksi – tu je ogroman broj poligona i efekata
koji se izvršavaju u Shader jedinicama, celih 128 MB video memorije je po nivou
rezervisano i zajedno sve izgleda jednostavno fenomenalno. Fotorealistična grafika
i do sada najbolja fizika i dizajn nivoa su atributi ove fenomenalne igre. Tu
su i shaderi za Normal mapping, napredne enviroinment fizike, promenljiva geometrija
terena, dinamičke senke i osvetljenja, motion capture animacije… Testirali smo
sa Very high i Ultra high podešavanjima (gde je moguće), uz
pomoć već snimljenog i opšte prihvaćenog demoa. GeForce 6 i 7 serija kartica koristi
Shader Model 3.0, ali smo HDR, naravno, iskljucili kako bi poredjenje sa konkurentom
bilo fer.
Evo i "zahtevnijeg" moda, u kome GeForce 7800GTX obicno i pokazuje šta
ume i može…
CS: Source Video Stress test
Novi Counter Strike je stigao. Umesto da kreiramo demoe na postojeći mapama, nas
je pre zanimalo kako će osnovni efekti u Source Engine-u raditi na novim karticama,
pa smo pokrenuli Video Stress test koji se nalazi u glavnom meniju, uz najviša
moguća setovanja u video sekciji.
Half Life 2
Sta reći o igri koja je čekana čitavih pet godina i prema mnogim mišljenjima i
prevazišla najviša moguća očekivanja. Engine nije toliko napredan kao onaj kod
igre FarCry ili čak Doom 3, ali je moćan, fleksibilan (skalabilan) i odlično optimizovan,
te svakako pokazuje kakve će performanse kartice dati u igrama koje očekujemo.
Testirali smo sa najvišim kvalitetom (highest), samo su Anisotropic i Antialiasing
bili isključeni.
Transparent AA – SuperSampling vs. MultiSampling / HDR test
Kao što smo i obećali, evo testova u kome poredimo koliko performanse opadaju
kada se koristi Transparentni antialiasing…
Kao što vidite, najzahtevniji mod je Transparency Supersampling AA, dok transparentni
Multisampling AA koji je tek nešto sporiji od klasicnog multisampling FSAA, daje
najbolje rezultate.
U sledecoj tabeli možete videti koliko novi GeForce usporava kada se aktivira
HDR mode 7 u igri FarCry 1.31.
Nije u pitanju mala razlika, ali GeForce 7800GTX to svakako radi uz manji pad
performansi (procentualno posmatrano).
Overclocking
Tokom rada u 2D režimu, kuler na kartici je prilično tih, a metalni profil hladan,
da bi nakon nekoliko desetina minuta bio sasvim mlak, ali nikada previše vreo.
Tokom overkloking sesije, ventilator kulera zna povremeno da ubrza, što se lako
oseti ali ne smeta previše, osim ako niste navikli na idealno tihu mašinu. Ohrabreni
rezultatima stranih kolega, krenuli smo sa dodatnim ubrzanjem, pa smo sa početnih
430 / 1200 MHz, došli do stabilnih 490 / 1320 MHz, dok je za prikaz bez ijedne
greške memoriju potrebno spustiti na 1290 MHz, što je ok rezultat za poznate
Samsung GDDR3 1.6 ns memorijske čipove. Ipak, postoje primerci GeForce 7800GTX
kartica koji bez problema idu na 600 / 1400 MHz, pa se naš rezultat može smatrati
samo prosecnim. Pogledajmo kako se rezultati povecavaju kada se kartica dodatno
ubrza.
Zaključak
Nema sumnje, GeForce 7800GTX je daleko moćniji akcelerator nego što smo očekivali
kada smo saznali da će imati “samo” 24 pixel pipeline jedinice. Iako nVidia tvrdi
da se radi o potpuno novom GPU-u, na nekoliko primera se vidi “nasledstvo” od
nV40 arhitekture, što i nije toliko loša stvar – najbitnije je što je nV40 bio
dosta drugačiji od nV30. G70, opet, nije samo nV40 sa više pipeline-a, već je
dosta toga, kao što smo i objasnili, unapređeno. Sa aspekta krajnjeg korisnika,
7800GTX ima šta da ponudi, ali samo onima koji su priželjkivali dva 6800 Ultra
akceleratora u SLI modu – nova high end kartica je uglavnom isto toliko brza,
a nema potrebe igrati se sa profilima i gledati da li softver podržava nVidia
DualGPU soluciju.
Nova kartica je moćnija, ali nije srazmerno zahtevnija niti bučnija od prethodnika,
naprotiv. G70 je isti onaj moćni GPU koji će naći svoje mesto u sledećoj Sony
PlayStation konzoli (osim nekoliko sitnih razlika i 90-nm postupka proizvodnje),
što dovoljno govori o potencijalu ove tehnologije. Novih mogućnosti na listi nema
u velikom broju (mada je Transparentni AA zaista prijatno iznenađenje), ali znamo
da Microsoft nije najavio novu verziju okruženja za programere pre nego što se
Longhorn pojavi u prodaji, pa je konačno došao trenutak da dizajneri počnu da
koriste sve što DirectX 9.0c ima da ponudi. GeForce 7800GTX, odnosno MSI NX7800GTX
ima i više snage nego što je danas potrebno i u najzahtevnijim igrama, čak i ako
aktivirate HDR mod zajedno sa maksimalnim anisotropic i antialiasing filterima.
Ako je nekome potrebno više, nova kartica i dalje podržava SLI mod, pa je već
sada moguće kreirati ekstremno brze sisteme sa dve GF 7800GTX kartice. Kako se
pokazalo da je G70 sposoban da radi i na višim frekvencijama, a u najavi su i
brži memorijski čipovi, ne sumnjamo da će uskoro biti predstavljena još brža verzija,
moguće i sa čitavih 512 MB VRAM-a, dok će najvećem broju korisnika biti primamljiv
i tek najavljeni GeForce 7800 GT, koji bi trebalo da je baziran na istom hardveru
kao i 7800 GTX, uz niže podrazumevane radne frekvencije. Ova kartica je “u najavi”
jeftinija za 100€, pa je ovo još jedan udarac za konkurenciju.
Na kraju, moramo reći da, bez obzira na aplikaciju u kojoj radite, GeForce
7800GTX jeste najbrži 3D akcelerator na tržištu (posebno je važno ovo “na tržištu”),
nema ni najmanjih problema sa stabilnošću ili drajverima i može propisno da
se overklokuje. Ako želite bolje od najboljeg i imate mogućnosti, dodajte još
jednu takvu – garantujemo da u okruženju, jako dug niz meseci u 3D performansama
niko neće moći da vam parira. Čestitamo kompaniji nVidia i partneru MSI
International na odlično obavljenom poslu i možemo reći da jedva čekamo
da cene padnu na prihvatljiviji nivo.
Zahvaljujemo se kompaniji Pakom
A.D. na MSI NX7800 GTX kartici ustupljenoj za potrebe testiranja.