Branko Maksimović nVidia GeForce FX 5950 Ultra – Microstar Uvod GeForce FX 5950 Ultra je najjači član osvežene nVidia CineFX 2.0 familije kartica.
Ova familija se sastoji i od modela FX 5700 Ultra, zatim modela GeForce FX 5700
i FX 5600XT 128-bit. Iako mnogi od čitaoca već znaju da nisu u pitanju proizvodi
koji donose nešto suštinski novo, mnogo bitnija činjenica od jednostavnog podatka
koliko je FX 5950 Ultra brži od FX 5900 Ultra modela, bavi se time kako su novi
modeli pozicionirani u odnosu na konkurenciju. Pored sve aktuelnije priče o
ForceWare drajverima i optimizaciji kompajlera za izvršavanje kompleksnih Shader
rutina, odnos performansi i generalnog kvaliteta igranja sa jedne i cene sa
druge strane, bitniji je nego ikad, jer se u svakom cenovnom razredu, kojih
je sve više, može kupiti brža kartica za samo desetak dolara više. Zato je nVidia
pokušala da, uz fantastične napore da prevaziđe “nekonvencionalni” dizajn svojih
grafičkih procesora, bude agresivnija u ratu cenama. Nekoliko izgubljenih bitki
u tzv. “shaders ratu” ne znači da je sve gotovo.
Kao što je sada već poznato, GeForce FX kartice ne pate od hronično “loše” arhitekture
svojih GPU-ova… Međutim, može li se u zaključku ipak sama nVidia provući kao jedan
od glavnih krivaca za lošije performanse svojih kartica? ATI je, može se reći,
učestvovao i radio zajedno sa Microsoftom u kreiranju devetog izdanja Direct X
API-ja, dok je nVidia “bežala sa nastave”. Drugim rečima, položeno je previše
nade u Cg kompajler, i to u vreme samog dizajniranja nV30 GPU-a. Ako se podsetimo
kako je ovo bio težak period za samu kompaniju (TSMC, kašnjenja, kompleksan layout,
loš yield), biće jasno da je i generalni neuspeh Cg-a bio još jedan udarac u nVidiine
klimave noge. Sa druge strane, ATI je samo logično nastavio sa evolucijom R300 GPU-a, iz koga
je nastao derivat izrađen u 0.13 mikronskom procesu (RV350). R350 bi, shodno
tome, mogli da nazovemo i R300 v1.2, dok bi R360 mogao nositi oznaku R300 v1.3.
I nVidia tržištu nudi samo dorađene varijante starih kartica – ali ponovićemo,
mnogo je bitnije da ima novih modela, jer se tako trend pada cena nastavlja
nekim već odavno ustaljenim tempom. C for Graphics je kompajler optimizovan za CineFX kartice onoliko koliko je Direct
X High Level Shading Language optimizovan za ATI R3xx GPU-ove. NVidia nije uspela
da skupi mnogo softverskih kompanija da koriste Cg (mada ovih igara ipak ima,
što na tržištu, što u pripremi); nekako je logičnije bilo privoleti se Microsoft-u.
Zapravo, HLSL kao softverski alat, pravljen je paralelno sa dizajniranjem R300
GPU-a. Cg je, prema navodima iz kompanije nVidia, optimizovan, jednostavan i dovoljno
fleksibilan da ga maksimalno mogu iskoristiti i GPU-ovi drugih proizvođača. U
kompaniji čak tvrde, da je Cg mnogo više prijateljski nastrojen ka ATI-jevim VPU-ovima,
nego što je to HLSL ka nV3x video akceleratorima.
Optimizacija se, ipak, nastavlja i nVidia je poučena novim iskustvom, možda
i spremnija za narednu rundu. Jedan od razloga zbog koga to možemo da damo kao
neku vrstu prognoze, jeste ipak tehnološki moćnija arhitektura nV35/38 GPU-ova.
Dok nVidia ima osam Floating Point 32 (FP32) jedinica za procesiranje (samim
tim kompatibilne sa instrukcijama širine FP16 i FP24), ATI ima isto toliko FP24
jedinica. Ako znamo da je skok sa čip pajplajna koji rade samo sa celobrojnim
vrednostima na FP24 pajplajn GPU zahtevao oko 80% veći broj tranzistora (ukupno,
i po pajplajnu), onda možemo da očekujemo barem 50% povećanje ukupnog broja
tranzistora pri prelasku sa FP24 na FP32. nVidia poseduje funkcionalne celine
koje rade sa FP32 instrukcijama, a nV38 ima približno 125 miliona tranzistora.
ATI ima jedinice koje rade sa instrukcijama maksimalne širine FP24, i ima 113
miliona tranzistora. Pošto je sada većina aktuelnih igara rađena u FP16 kolor formatu (Half Life
2 je FP24), ne očekujemo da će ATI uskoro ponuditi FP32 GPU, barem dok se 0.13
mikronski proces ne razradi u dovoljnoj meri. Moguće je, čak, da će za njihov
FP32 GPU biti potreban i 90 nanometarski proizvodni proces, ali o tome nemamo
previše informacija, pa možemo samo da nagađamo.
Trend blagih ubrzanja Tradicionalno predstavljanje GPU-a, koje je deo svakog testa suštinski inovativnog
proizvoda, možda će vam se učiniti poznato, ali to je samo zbog toga što ste ga
već čitali ranije (ako ste imali strpljenja, naravno). Da, jedina razlika koju
nV38, osim kodnog imena, odvaja od nV35 GPU-a, jeste u brzini radnih frekvencija.
Za neke informacije cete morati da pogledate neke od nasih starijih
testova (Radeon 9700 Pro, Radeon 9800 Pro, GeForce FX 5900). nV38 je, kao i nV35 pre njega, dorađena verzija nV30 GPU-a. U samo jezgro je dodato
nekih 10 miliona tranzistora, koji su potrošeni na veće keš i queue memorije i
eventualno “peglanje” arhitekture da bi se čip manje zagrevao. Neke od informacija
govore o tome da je deo integer Memorijska magistrala nije više 128-bitna, tu
je sada novi memorijski kontroler ukupne širine od 256-bita, dok je memorija koja
se koristi standardni DDR, mada mnogo brži od svega što smo do sada videli. FX5950
je predviđen da radi na 475MHz za jezgro i 950MHz za memoriju:
Bench-House
NVIDIA
GeForce FX 5900
NVIDIA
GeForceFX 5900 Ultra
NVIDIA
GeForce FX 5950
Proces
Proizvodnje
NV35 0.13 Micron
NV35 0.13 Micron
NV35 0.13 Micron
Broj
tranzistora
~135 Miliona
~135 Miliona
~135 Miliona
Memorijska
Magistrala
256-bit DDR
256-bit DDR
256-bit DDR
Memorijski
Propusni Opseg
25.9 GB/s
27.2 GB/s
30 GB/s
AGP
Standard
AGP 3.0 4x/8x
AGP 3.0 4x/8x
AGP 3.0 4x/8x
Podržane
memorijske konfiguracije
128MB/256MB
128/256MB
128MB/256MB
Radni
takt jezgra
400 MHz
450 MHz
475 MHz
Radni
takt memorije
400 MHz (800 DDR)
425 MHz (850 DDR)
475 MHz (950 DDR)
Tip
memorije
BGA 2.4 ns DDR
BGA 2.2 ns DDR
BGA 2.0 ns DDR
Broj
Pipeline-a
4* (8)
4* (8)
4* (8)
Broj
teksturnih jedinica po pipeline-u
2* (1)
2* (1)
2* (1)
Vertex
Shader jedinice
3
3
3
Podržana
verzija Vertex Shader-a
2.0+
2.0+
2.0+
Podržana
verzija Pixel Shader-a
2.0+
2.0+
2.0+
Verzija
Direct X API-ja
9.0+
9.0+
9.0+
Hardverski
tip FSAA
Ordered Grid MultiSampling / SuperSampling
Ordered Grid MultiSampling / SuperSampling
Ordered Grid MultiSampling / SuperSampling
Tehnike
optimizacije
LMA III+ / HSR / Z-buffer/Frame
buffer compression, UltraShadow/Color Compression
LMA III+ / HSR / Z-buffer/Frame
buffer compression, UltraShadow/Color Compression
LMA III+ / HSR / Z-buffer/Frame
buffer compression, UltraShadow/Color Compression
Integrisani
RAMDAC / DVD engine/ TV out encoder
Integrated 2 x 400 MHz / HW MPEG
IDCT, MC, DeInterlacing / nV35 internal (Third party encoder supported)
2 x 400 MHz / HW MPEG IDCT, MC,
DeInterlacing / nV35 internal encoder (Third party encoder supported)
Integrated 2 x 400 MHz / HW MPEG
IDCT, MC, DeInterlacing / nV35 internal (Third party encoder supported)
Interna
RGBA paleta
40-bitna (10-bita po boji)
40-bitna (10-bita po boji)
40-bitna (10-bita po boji)
Može se odmah primetiti da je i nV38 za nV30 ono što je nV25 bio za nV20, odnosno
da se radi o blagoj evoluciji tehnologije, i da zapravo nema velikih koraka unapred.
Iz tog razloga, nV38 je predstavljen kao deo FX5xxx familije, te je ovoga puta
nVidia igrala fer igru i nije preterano pompezno najavljivala novu high end karticu,
niti joj davala neku od, u ovom slucaju pretencioznih FX6x00 oznaka. Kao i nV30, i novi nV38 GPU ima programabilnu arhitekturu koju je teško razvrstati
na određen broj pipeline-a, odnosno jedinica za teksturni menadžment (za više
informacija pogledajte test GeForce FX 5800 kartice). Ono što je zanimljivo, jeste
da ovo zaista nije nikakva marketinška fraza, te su saznanje da je nV30 zapravo
4×2, a ne 8×1 GPU i negativne kritike upućene kompaniji bile preuranjene. Ipak,
arhitektura nije još toliko usavršena, pa se nV30 ponašao kao 8×1 GPU samo kada
se rade kalkulacije frejma koji je već učitan u rendering jedinice, odnosno kada
se obrađuju informacije poslate iz Z/stancil buffera. Teksturisanje odnosno Pixel
Shading, odrađuju se “dvostruko sporije”, jer se u tom momentu GPU opet ponaša
kao 4×2. Prema nekim informacijama, kod GeForce FX5600, odnosno nV31 video čipa
(ali ne i nV34), nVidia je uspela da reši problem, tako da se ovaj mikroprocesor
ponaša kao 4×1 GPU u situacijama kada je to korisnije (singletexturing), odnosno
kao 2×2 GPU kada se rade scene sa multiteksturisanjem. Ipak, nV35 nema ovu mogućnost,
pa se ponaša isto kao i nV30, odnosno koristi 8×1 konfiguraciju (pipelinea i TMU-ova)
samo kada radi kalkulacije iz Z-buffer-a i Stancil Buffer-a. S obzirom na to da
su ove brze memorije dosta povećane kod novog GPU-a, to možda i ne mora da bude
mana, a tu će negde, ako bude adekvatne softverske podrške, na scenu stupiti i
UltraShadow tehnologija. Novi memorijski kontroler je i ovoga puta crossbar tipa (za više informacija o
ovom tipu memorijskog kontrolera pogledajte naše prve GeForce 3 i GeForce 4 prikaze).
Svaka od tehnologija optimizacije memorijskog propusnog opsega, odnosno kompresije
Z-buffer podataka, Fast Z Clear, Color Compression i sistemi koji spadaju pod
Intellisample High Resolution Compression Technology su sada i do 50% efikasniji.
Ovo je sasvim logično, pošto nadogradnja i fino poliranje postojećeg čipa može
da se vrši i nakon njegove proizvodnje (svaki mikroprocesor se, naravno, projektuje
u softveru), pa se tako neka nova rešenja i poboljšanja primenjuju u narednim
generacijama mikroprocesora. CineFX 2.0 i UltraShadow Bez obzira na to što je nVidia najviše potencirala Shader sposobnosti svog novog
GPU-a, mogućnost rada sa veoma dugačkim Shader programima, realtime efekte poput
onih u holivudskim filmovima i sl., poređenje sa ATI R300 baziranim karticama
u Pixel Shader testovima je pokazalo da je nV30 sporiji i do tri puta od konkurenta,
bez obzira i na to što radi na višim radnim učestanostima. Upravo zbog toga je
dosta toga poboljšano kod nove CineFX generacije kartica, a broj tehnologija koje
imaju posebna imena, ponovo je porastao. One za koje već znamo, dobile su veći
broj verzije iza naziva i tvrdnju da su dodatno poboljšane ili optimizovane. Tehnologija
UltraShadow podrazumeva optimizaciju rada sa dinamičkim stancil buffer senkama,
koje će u narednoj generaciji igara oduzimati poprilično mnogo GPU vremena za
kalkulaciju.
Ova tehnologija ne radi “sama”, odnosno mora biti podržana u kodu same softverske
mašine koja pokreće određenu igru. Programer tako može odrediti z-vrednost, odnosno
daljinu od virtuelne kamere, posle koje se kalkulacije sa senkama neće izvršavati.
Kao što vidite na slici, prividna udaljenost Z vrednosti nije konstantna po celoj
Y (vertikalnoj) osi, pa cela tehnologija može da ima smisla, jer svakako smanjuje
opterećenje na sam GPU bez ikakvih vidljivih kompromisa. Takođe, programer može
da odredi i nekoliko nivoa Z vrednosti, pa se, recimo posle prvog kalkulacije
sa senkama mogu odrađivati manje kompleksno. To može da bude korisno kod igara
koje imaju pravo dinamičko osvetljenje, i čije senke nemaju jednostavne, oštre
ivice, već objekti, u odnosu na to da li su osvetljeni sa spot i/ili ambijentalnim
osvetljenjem, mogu praviti senke sa mekim ivicama i različitim intenzitetom. Dakle,
sumirano, UltraShadow je još jedna od tehnika optimizacije, ovoga puta uvrštena
direktno u rendering sistem, dok je CineFX 2.0, odnosno izvršavanje Pixel Shader
programa (pre svega mislimo na PS 2.0, na koje će se programeri posebno usresrediti
u predstojećem periodu) duplo efikasniji od onog kod prethodnog nVidia high end
GPU-a. Novi grafički procesor iz najviše klase, sadrži između 130 i 135 miliona tranzistora,
proizveden je u IBM-ovim proizvodnim pogonima, ali se ne zagreva ni blizu onoga
što smo mogli da primetimo kod nV30 baziranih kartica. Tako je i FlowFX ovoga
puta izostao, a referentna nVidia nV38 Ultra kartica ima hlađenje slicno onom
na referentnim GeForce FX 5800 modelima. Gainward, Leadtek, ASUS pa i Microstar,
imaju dosta drugačija rešenja za hlađenje – većina ne zahteva dodatni PCI slot,
najbliži AGP-u, niti su bučnija od prosečnog Radeona 9800 Pro ili Titaniuma 4800,
recimo. Ovoga puta, izbor za 256-bitnu memorijsku magistralu i odgovarajući kontroler,
u sprezi sa brzom DDR memorijom je bio logičan, u toj meri da je nejasno zašto
je nVidia ikada eksperimentisala sa DDRII memorijom, a zadržavala memorijski kontroler
sličan onom na karticama iz prethodne generacije. Sasvim je moguće da bi projektovanje
256-bitnog kontrolera, koji sada radi sa novim tehnikama koje su deo Intellisample
HCT “engine”-a, oduzelo ili isuviše vremena, ili prostora na die-u, pa se od toga
odustalo i napravljen je jedan kompromis.
Kao i kod nV30 i nV35 grafičkih procesora, Vertex Shader programe koje je nV38
sposoban da izvrši prevazilaze verziju 2.0. To znači da će moći da sarađuje i
sa programima koji imaju 65536 instrukcija, za razliku od Radeona 9800 Pro koji
maksimalno “čita” 1024 instrukcije. Kontrola dinamičkih i loop-ovanih instrukcija,
grananje i upotreba sub-rutina spadaju u novosti (R300, R350 i R360 rade samo
sa statičkim), kao i izmena i izvršavanje nelinearnih programa. Varijable ubačene
u naredni shader program mogu da odrede vreme i način tranzicije i izmene samog
programa i to tokom njegovog izvršavanja. Ovo znači da nije potrebno imati više
shader programa za svaki zadatak, već jedan veći koji se može granati po potrebi
ili imati podprogram, odnosno sub-rutinu koja će ga pozvati da bi mogao da izmeni
tok izvršavanja na neku od postojećih grana. Kako većina kratkih shader programa
ima dosta delova koji se poklapaju, jasno je da je jedan već učitani program sa
granama efikasniji, odnosno da će se sve izvršavati brže, uz više mogućnosti.
Shader unutar nV38 GPU-a je, dakle, mnogo fleksibilniji. Ostatak tehnologija je
isti kao i kod prethodne generacije, ali nije na odmet pomenuti ponovo neke od
njih koje spadaju u novije. Pored crossbar memorijskog kontrolera, čije su nam karakteristike poznate, u okviru
LightSpeed Memory Architecture sistema, sada su i još neki alati koji bi trebalo
da podignu ukupne performanse na viši nivo. Alati za kompresiju Z-buffer-a, kolor
kompresija, filtering tekstura i antialiasing su zajedno nazvani Intellisample
tehnologija, koja je sada dobila i sufiks HCT. Color compression koji je za nV35
donekle unapređen, konceptualno je smešten između memorije i rendering sistema.
Svaki podatak kompresuje u odnosu od 4:1, bez vidljivog gubitka na kvalitetu (što
se može podesiti u drajverima). NVidia tvrdi da je color compression najbolje
iskorišten u situacijama kada je aktiviran njihov ordered grid multisampling antialiasing. Ostali sistemi za kompresije su preuzeti iz prethodne generacije i u odnosu na
nV30 ne donose nikakve novitete ni poboljšanja. Z-Occlusion Culling kao dominantan deo tehnologija za kompresiju podataka,
pomoću informacije iz Z-Buffer-a, kalkuliše koje će površine i delovi površina
biti vidljivi prilikom prikaza na ekranu. Površine koje stoje iza drugih objekata
naravno neće biti procesirane, pa tako neće biti potrebno da se za njih namenjene
teksture uopšte salju i opterećuju memorijsku magistralu. Fast Z Clear i dalje obavlja posao tako što frame-buffer, pre svakog
novog frejma, postavi u početno stanje i to za daleko manje vremena od onog koje
bi bilo potrebno za klasičnog pražnjenje. Takođe, postoji i sistem koji obavlja
fast color clear, ali je on manje bitan od Fast Z Clear sistema. Lossless Z Compression je tehnika koja se brine da se podaci koji se
šalju i čuvaju u Z-buffer-u kompresuju u odnosu 4:1, bez gubitaka. Memory Auto Pre-Charge je naziv za rešenje koje kao rezultat rada smanjuje
vreme čekanja rendering sistema na memoriju koje nekada može biti i do 10 ciklusa.
Pre-Charging se vrši u delovima memorije koji se u datom trenutku ne koriste i
za koje je algoritmom utvrđeno da će se ubrzo koristiti. Tako se na poseban način
ovaj deo memorije priprema za bržu reakciju kada procesor to zatraži (skraćenje
čekanja na 2-3 ciklusa). Quad Cache je naziv za četiri cache sistema Vertex Cache , Primitive
Cache, Pixel Cache i Dual Texture Cache o kojima smo detaljnije pisali u review-u
video akceleratora GeForce 4 Ti4600 i Ti4400. Kao što možete videti, nV35 nije doneo ni blizu onoliko kvalitativnih i evolucionih
pomaka u odnosu na nV30, koliko je ovaj doneo u odnosu na nV25 video akcelerator.
Shading kalkulacije su intenzivnije, tu je UltraShadow kao jedina prava novost,
dok je sve ostalo samo “naduvavanje mišića” i “facelifting” FX-a 5800. Philips Video procesor Pošto najveći broj novih GeForce FX kartica poseduje Philips SAA7108AE (kao naša
Microstar FX5950 Ultra VTDR256 kartica) ili 7114H, daćemo opštu specifikaciju
ovih video enkoder/dekoder čipova: Video dekoder
Six analog inputs, internal analog source selectors, e.g. 6 x CVBS
or (2 x Y/C and 2 x CVBS) or (1 x Y/C and 4 x CVBS) Two analog preprocessing channels in differential CMOS style for best
S/N performance Fully programmable static gain or Automatic Gain Control (AGC) for the
selected CVBS or Y/C channel Switchable white peak control Two built-in analog anti-aliasing filters Two 9-bit video CMOS Analog-to-Digital Converters (ADCs), digitized CVBS
or Y/C signals are available on the Image Port Data (IPD) port under I²C-bus
control On-chip clock generator Line-locked system clock frequencies Digital PLL for horizontal sync processing and clock generation, horizontal
and vertical sync detection Requires only one crystal (either 24.576 MHz or 32.11 MHz) for all standards
Automatic detection of 50 and 60 Hz field frequency, and automatic switching
between PAL and NTSC standards Luminance and chrominance signal processing for PAL BGHI, PAL N, combination
PAL N, PAL M, NTSC M, NTSC-Japan, NTSC N, NTSC 4.43 and SECAM User programmable luminance peaking or aperture correction Cross-colour reduction for NTSC by chrominance comb filtering PAL delay line for correcting PAL phase errors Brightness Contrast Saturation (BCS) and hue control on-chip Two multi functional real-time output pins controlled by the I²C-bus Multi-standard VBI data slicer decoding World Standard Teletext (WST),
North-American Broadcast Text System (NABTS), Closed Caption (CC), Wide
Screen Signalling (WSS), Video Programming System (VPS), Vertical Interval
Time Code (VITC) variants (EBU/SMPTE) etc. Standard ITU 656 Y-CB -CR 4 :2 :2format (8-bit) on IPD Enhanced ITU 656 output format on IPD output bus containing: active video raw CVBS data for INTERCAST applications (27 MHz data rate) decoded VBI data Detection of copy protected input signals according to the Macrovisiontm(1)
standard. Can be used to prevent unauthorized recording of pay-TV or video
tape signals. 1.2 Video scaler Both up and downscaling Conversion to square pixel format NTSC to 288 lines (video phone) Phase accuracy better than 1/64 pixel or line, horizontally or vertically
Independent scaling definitions for odd and even fields Anti-alias filter for horizontal scaling Provides output as: scaled active video raw CVBS data for INTERCAST, WAVE-PHORE, POPCON applications or general
VBI data decoding (27 MHz or sample rate converted) Local video output for Y-CB -CR 4 : 2 : 2 format (VMI, VIP, ZV).
Video encoder
Digital PAL/NTSC encoder with integrated high quality scaler and anti-flicker
filter for TV output from a PC Supports Intel® Digital Video Out (DVO) low voltage interfacing to graphics
controller 27 MHz crystal-stable subcarrier generation Maximum graphics pixel clock 85 MHz at double edged clocking, synthesized
on-chip or from external source Programmable assignment of clock edge to bytes (in double edged mode)
Synthesizable pixel clock (PIXCLK) with minimized output jitter, can be
used as reference clock for the VGC, as well PIXCLK output and bi-phase PIXCLK input (VGC clock loop-through possible)
Hot-plug detection through dedicated interrupt pin Supported VGA resolutions for PAL or NTSC legacy video output up to 1280
x 1024 graphics data at 60 or 50 Hz frame rate Supported VGA resolutions for HDTV output up to 1920 x 1080 interlaced
graphics data at 60 or 50 Hz frame rate Three Digital-to-Analog Converters (DACs) for CVBS (BLUE, CB ), VBS (GREEN,
CVBS) and C (RED, CR )at 27 MHz sample rate (signals in parenthesis are
optionally selected), all at 10-bit resolution Non-interlaced CB -Y-CR or RGB input at maximum 4 :4 :4 sampling Downscaling and upscaling from 50 to 400pct Optional interlaced CB-Y-CR input of Digital Versatile Disk (DVD) signals
Optional non-interlaced RGB output to drive second VGA monitor (bypass
mode, maximum 85 MHz) 3 x 256 bytes RGB Look-Up Table (LUT) Support for hardware cursor HDTV up to 1920 x 1080 interlaced and 1280 x 720 progressive, including
3-level sync pulses Programmable border colour of underscan area Programmable 5 line anti-flicker filter On-chip 27 MHz crystal oscillator (3rd-harmonic or fundamental 27 MHz
crystal) Fast I²C-bus control port (400 kHz) Encoder can be master or slave Adjustable output levels for the DACs Programmable horizontal and vertical input synchronization phase Programmable horizontal sync output phase Internal Colour Bar Generator (CBG) Optional support of various Vertical Blanking Interval (VBI) data insertion
Macrovision Pay-per-View copy protection system rev. 7.01, rev. 6.1 and
rev. 1.03 (525p) as option; this applies to SAA7108AE only. The device
is protected by USA patent numbers 4631603, 4577216 and 4819098 and other
intellectual property rights. Use of the Macrovision anti-copy process
in the device is licensed for non-commercial home use only. Reverse engineering
or disassembly is prohibited. Please contact your nearest Philips Semiconductors
sales office for more information.
Common features
5 V tolerant digital I/O ports I²C-bus controlled (full read-back ability by an external controller,
bit rate up to 400 kbits/s) Versatile power-save modes Boundary scan test circuit complies with the “IEEE Std. 1149.b1-1994”
(separate ID codes for decoder and encoder) Monolithic CMOS 3.3 V device BGA156 package Moisture Sensitive Level (MSL): e3.
Referentna FX 5950 Ultra
Referentna GeForce FX 5950 Ultra kartica se dosta razlikuje od one koju smo
mi premijerno imali na testu. Vrlo neobično za tako bliskog nVidiinog partnera,
je da primeni sopstveni dizajn kartice. Karticu koju je najverovatnije proizvela
kompanija 3DLabs (ili je u pitanju kooperacija sa Leadtek-om) za potrebe testiranja
i pre-view testova na internetu, vodi se kao referentna nV38 Ultra kartica.
Jezgro i memorija rade na 475 MHz (memorija efektivno 950 MHz), a upotrebljeno
je posebno dual slot hlađenje, koje nas izgledom podseća na nepopularni FlowFX.
Kao što na slikama možete videti, izrađena je na klasično lakiranom, zelenom
PCB-u, layout je veoma sličan FX 5900 Ultra karticama, sa karakterističnim rasporedom
memorijskih čipova, po dva, oko GPU-a, sa obe strane štampe. Putem 256-bitne
magistrale, komunicira 16 memorijskih čipova marke Hynix sa vremenom pristupa
od 2ns (ili 1000 MHz) !!! U pitanju je svakako, do sada najbrža memorija sa
kojom smo se susretali. Nova FX familija Kao što smo pomenuli na početku testa, FX5950 Ultra je najjači predstavnik
nove familije. NV36 na modelima FX5700 Ultra i FX 5700 će biti veoma zanimljive,
jer su ove kartice veoma slične FX5800 modelima, za koje znamo da imaju respektabilne
performanse. Još lepše od toga je što će one biti pozicionirane kao Radeon 9600
Pro i 9600, a očekujemo da budu solidno performantnije. U nižoj klasi, nVidia
nudi modele FX 5600XT 128-bit i 64-bit koji su tu da (cenom) zamene FX5200 Ultra,
odnosno FX5200. One predstavljaju konkurenciju Radeon 9600SE i 9200 karticama,
od kojih bi trebalo da predstavljaju bolja rešenja. Ovoga puta, načelno, možemo
biti zadovoljni novom GeForce FX familijom kartica, a više o njima kada kod
nas dođu na detaljan test. Kartica sa testa
Postao je gotovo običaj, da prvu od udarnih nVidia high end modela, predstavimo
na Microstarovom primeru. Informacije koje smo dobili iz kompanije, ukazuju na
to da je korišten drugačiji nacrt za izradu, nego što je to nVidia predvidela.
Možemo da se kladimo – Microstar je bio ubeđen da će njihov Top Tech cooling sistem
biti jednako efikasan kao i referentni nVidiin, ali zato daleko elegantniji (single
slot rešenje). Krenimo od samog pakovanja.
U kutiji, koja je opet u formi omanjeg putnog kofera, nalazi se Microstarov bundle.
Od igara, prisutni su: Morrowind, Ghost Recon, Duke Nukem Manhattan Project, The
Sum of All Fears, IL2 Sturmovik, Serious Sam The Second Encounter, odlični Rally
Trophy, Beam Breakers, Zax i Oni. Softverski paket obuhvata InterVideo WinDVD
plejer i WinDVD Creator Plus, Adobe Photoshop Album SE, Virtual Drive i Restore
IT, MSI drajver pack CD kao i neizbežni Media Center Deluxe.
Naravno, tu su i stari dobri LiveUpdate! 2 sistem, a novost je D.O.T tj. Dynamic
Overclocking Utility. MSI se potrudio da novost koju je uspešno predstavio ATI
sa funkcijom Overdrive, ima i jedna nVidia kartica. Tako postoji pet nivoa overkloking-a,
i to procentualno, u odnosu na početnu frekvenciju – Private, Sergegant, Captain,
Colonel, General i Commander (od 2 do 10% ubrzanja). Zanimljivi nazivi, mada
verujemo da komandant ipak vredi više od pukih 8% u odnosu na mladog redova. Naravno, tu su svi potrebni razdelnici, adapteri, kablovi… i manje potrebne stvari
(MSI sticker za kućište i simpatičan blokčić).
Referentni dizajn koji je Microstar ovoga puta donekle zaobišao učinio je MSI
FX5950 Ultra VTDR256 karticu tišom i kompaktnijom. Tradicionalno crveni PCB sa
svojih deset slojeva, poslužio je i ovoga puta kao osnova za jednu high end nVidia
karticu.
Standardni konektori – DVI, S-Video i D-Sub, donekle su ispremeštani. Da bi veliki
bakarni profil mogao da bude montiran, Philips SAA7108AE čip je pomeren ka dole,
prema takt generatoru, kod koga imamo i dodatna dva elektrolita, radi stabilnijeg
napajanja brzih ball bearing ventilatora.
Tako je SiliconImage čip pomeren ka gore, pa je onda zgodnije bilo rotirati i
sam DVI konektor sa D-Sub-om. Analogni konektor sada ima otkriven ceo RGB filter
(lepo se vide rezistori, tranzistori i diode za svaki od osnovnih signala). Kuler
je izrađen od nešto kvalitetnije legure bakra nego na prethodnim modelima i čini
se da je osnovni ventilator nešto veći.
Kapacitori, otpornici i MOLEX konektor su gusto spakovani desno od kulera. Ugrađeno
je 16 memorijskih čipova, raspoređenih sa obe strane štampe. Microstar je takođe
koristio Hynix čipove od 2ns u micro BGA formatu. U pitanju su 16-bitni DDRI čipovi,
naravno.
Sa druge strane štampe se nalazi masivan hladnjak za memoriju, kao i nešto manji
kuler koji dodatno hladi jezgro sa druge strane, i odvodi topao vazduh dalje od
bakarnih profila oko njega. U slučaju da isti udara u kuler od north bridge-a
na ploči ili nekako otežava instalaciju, možete ga skinuti, za šta na stickeru
koji dolazi na samoj kartici, postoji i objašnjenje.
U radu, kartica se pokazala kao izuzetno stabilna, sistem je funkcionisao besprekorno
sa novim ForceWare drajverima (koji imaju toliko dodatnih opcija, da je third
party tweaker zaista nepotreban), a slika je bila oštra kao žilet. Da, razlika
u odnosu na vrhunske ATI kartice više nema. Pored svega, kartica je bila i relativno
tiha, bilo da govorimo o 2D ili 3D režimu.
Test Setup Kartice smo testirali na test sistemu prikazanom u tabeli:
Procesor
AMD Athlon XP 2300 MHz (fsb. 200MHz)
Matična ploča
Abit NF7-S v2.0 bios
v1.8 – powered by Chieftec Dragon 400W
Memorija
2x 256MB PC3200 Corsair
XMS LowLatency @ 6-2-2-2.0
Hard Disk
IBM DeskStar DTLA 120GXP
“Death Star” 60 GB
Video Karte
ASUS V9950 Ultra GeForce
FX 5900 Ultra 256 MB DDR – Detonator 44.03 MSI GeForce FX 5950 Ultra 256 MB DDR – Detonator 44.03 i ForceWare 52.16 Gigabyte ATi Radeon 9800Pro – 128 MB DDR- Catalyst 3.8 Club3D ATI Radeon 9800XT – 256 MB DDR – Catalyst 3.8
Monitor
Samsung SyncMaster
959NF
Cooling
Thermaltake TT7+
DVD uređaj
Pioneer 116 DVD-ROM
CDRW uređaj
Sony CDRW Drive CRX220E1
Operativni sistem
Windows XP Service
Pack 1 + Critical preSP2 Rollup Direct X 9.0b nVidia nForce 3.13 drivers pack
Igre/Bench programi
Quake 3 Arena v1.17 Unreal Tournament 2003 v2166 FutureMark 3DMark 03 Professional FutureMark 3DMark 2001 Second Edition (build 330) Aquamark 3 Commercial Plus Nova Logic Comanche 4 Benchmark Demo CodeCreatures Benchmark Demo SpecORG ViewSPEC Perf 7.1
nVidia GeForce FX5950 kartice smo testirali sa Quality Intellisample setovanjima.
Neke od programa za testiranje smo dodali, neke modove promenili, sto cete videti
tokom samog testiranja.
Poredjenje Detonatora i ForceWare drajvera Kao što vidite, FX5950 Ultra karticu smo uporedili sa FX5900 Ultra modelom koji
radi na 25 MHz manje za jezgro i 50 MHz manje za memoriju. Bez obzira što je realno
za očekivati da FX5950 Ultra bude tek za nijansu brža kartica, uz nove modele
je logično da i korisnik početnik instalira nove drajvere, pa smo zbog toga hteli
da uporedimo i koliki je celokupan ostvareni napredak (nV38 ultra + ForceWare).
Za one koje baš interesuju i dodatni detalji, specijalno smo testirali FX 5950
sa starim WHQL drajverima 44.03, sa kojima su testirane sve prethodne CineFX 2.0
kartice (iako oni zvanično ne podržavaju i ne prepoznaju pravilno karticu FX 5950
Ultra). Ova poređenja se nalaze na kraju svake od narednih strana, u posebnoj
tabeli. OpenGL – Quake III Arena Kao što znamo, Q3 Arena je stari dobri OpenGL benchmark kod koga važi pravilo
više megahertza – viši framerate. Verzija sa kojom testiramo je standardna 1.17
sa x86 optimizovanim dll-ovima.
Max Quality Setting: Teksture na najvišem nivou Geometrija na najvišem nivou Primenjeni: r_subdivisions 1 i r_lodError 0 High Quality Sky Ejecting Bras uključen
Sync Every frame isključen Lightmap lights Force Player Models isključen Dynamic Lights uključen Marks On Walls uključen Sound Quality low
U nižoj rezoluciji se ne vidi velika prednost ForceWare drajvera, koji ipak donose
optimizaciju na polju komunikacije sa HLSL kompajlera i eventualno generalno boljeg
korištenja resursa kartice. Međutim, i FX5950 Ultra jeste solidno overklokovani
FX5900 Ultra, pa je i zbog toga prednost u većim rezolucijama očiglednija. ATI,
kao i uvek u Quake-u III, zaostaje. OpenGL – SpecViewPERF 7.1 SpecOPS-ov OpenGL test koji pred video kartu postavlja nešto drugačije zadatke
nego što to čine poznate igre. Ovaj skup OpenGL programa testira specijalne funkcije
neke 3D kartice, koje se koriste u profesionalnim i poluprofesionalnim 3D aplikacijama
tipa CAD i 3D Modeling. Mi smo koristili smo poslednju aktuelnu verziju koji se
sastoji od šest celina. Kao što već znate, u pitanju je karakterističan i relevantan
test. Za više informacija o svakom delu ovog programaskog test paketa, možete
pogledati sajt proizvođača, ili neke od naših prethodnih testova. Update: Od ovog testa, prelazimo na noviju verziju SpecPerf paketa – 7.1,
koji donosi novi, složeniji 3dsmax test program, koji simulira intenzivan rad
u paketu 3D Studio Max (ne rendering, već realtime prikaz (preview) u radnom prozoru).
Takođe, design review test je nešto složeniji (pa su rezultati nešto niži), mada
se radi o istim OpenGL instrukcijama kao i kod prethodne revizije SpecPerf paketa.
DX test sada poziva neke osnovne Shader instrukcije (ekvivalentne PS v1.1 i v1.2
koje odgovaraju DX verziji 8.0). Lightscape test je takođe kompleksniji, a isto
važi i za pro engineering i ugs03. Shodno tome, dobijeni rezultati su nešto niži.
U većini testova, nVidia ima veliku prednost u odnosu na ATI karticu. Ugs-01 test
radi intenzivne vertex kalkulacije, dok dx-07 poziva neke Direct X instrukcije,
pa odlične performanse u ovim segmentima, daju R300 kartici ogromnu prednost.
Bez obzira na to GeForce FX kartice su ostavile bolji utisak u ovom relevantnom
benchmarku. ForceWare protiv Detonatora Kompajler analizira shader programe, razdvaja ih i prilagođava izvršavanje
njegovih funkcija na najbolji mogući način. On čak može da promeni redosled i
način izvršavanja ovih funkcija. Na kraju, sledi pregled dobijenog – da li se
finalna slika razlikuje od onoga što je programer zamislio. Najvažnije od svega
je što će svaki podržani shader ili neka njegova instrukcija raditi, bez obzira
na kompajler API-ja, dok kvalitet slike neće biti pogoršan ni u kom slučaju.
Sjajno, zar ne? U ovom testu se lepo vidi da su ForceWare dosta, dosta drugačiji
drajveri.
DirectX 8 performanse (Gaming) Unreal Tournament 2003 Odlični UT2003, patchovan na verziju 2166, u Direct3D izdanju. Testirali smo,
kao što znate, uz maksimalan nivo detalja. Kao i tokom testiranja kroz OpenGL,
mape koje smo koristili su flyby suntemple i botmatch suntemple, koja spada u
jednu od najzahtevnijih.
Bili smo zadovoljni kada smo videli prednost u odnosu na Radeon 9800XT, i to ne
zbog toga što nVidiu više preferiramo, već zbog toga što je sada konkurentnija
veoma skupom ATI-jevom modelu. Naravno, i ForceWare drajveri čine svoje! Comanche 4 Nova Logic-ov Comanche 4, je još jedan u nizu D3D testova, ali dovoljno karakterističan
da zasluži mesto koje trenutno uživa na test sajtovima. Novi Comanche koristi
Direct3D 8.1. ali radi i sa starijim karticama. Pri testiranju, smo koristili
apsolutni maksimum za geometriju, teksture, količinu efekata i granicu vidljivosti.
Zvuk je bio isključen u samom programu, a rezultati zaokruživani na dva decimalna
broja.
Poređenje verzija drajvera 44.03 i 52.16 na istoj kartici, pokazalo je da Comanche
4 ne pozdravlja optimizacije koje se tako dobro vide u prethodno prikazanoj igri.
Prednost koju ima FX5950Ultra u odnosu na 5900Ultra model, potiče od razlike u
radnim frekvencijama. ForceWare protiv Detonatora
Respektabilne razlike, uz identičan, visok, kvalitet prikaza!
Direct X 8 performanse (benchmark programi) CodeCreatures Benchmark Verovatno jedan od najlepših i najzahtevnijih testova koje koristimo jeste CodeCreatures
Benchmark. Baziran je na jednom od verovatno najkompleksnijih engine-a na koji
smo videli. Program koristi Shadere verzije 1.3 (Direct X 8.1), i odlično ukazuje
na to kako se kartica snalazi sa teksturama veoma visoke rezolucije i velikom
količinom poligona. Vizuelna atraktivnost i fotorealisticnost su na visokom nivou,
ali pod uslovom da kartica izvuče potrebnih 24 fps. Default test se izvršava u
tri rezolucije: 1024×768, 1280×1024 i 1600×1200. Moguće je kreirati batch u kome
je ćete izabrati sopstvene modove od rezolucija 640*480 do najvišeg grafičkog
moda koji kartica podržava.
Još jedan od testova u kome novi drajveri nisu pokazali prednost… Tako je vidljiva
marginalna prednost nV38 kartice, u odnosu na nV35 bazirani V9950 Ultra. Direct X 8 – FutureMark 3DMark 2001 SE Starija i po mnogima pouzdanija verzija 3DMark benchmark-a, i dalje nalazi mesto
na našem test poligonu. Rezultati su za nijansu (nekoliko promila) niži od kako
smo instalirali DirectX9.0b, ali u duhu zaštite od raznih virusa i worm-ova, bili
smo spremni i na ovakve gubitke.
Sjajan napredak ostvaren većim memorijskim bandwidth-om i boljim drajverima. Nekada
smo mislili da Detonatori jednostavno ne mogu biti bolji, zar ne? Direct X 9 – FutureMark 3D Mark 03 Kako je o 3Dmark 03 programu već dosta pisano i pričano, mi ćemo se uzdržati od
komentara i dodati da smo testirali po defaultu, koristeći sada dostupni build
330.
S obzirom na to da su u pitanju drajveri koje patch 330 sprečava da “varaju”,
jasno je da i GeForce FX 5950 i 5900 Ultre kao kartice sa definitivno sporijim
izvršavanjem DX9 Pixel i Vertex Shadera, daje sasvim dobre rezultate. Da li ce
stvari mnogo da se promene izlaskom Direct X 9.1 verzije API-ja (ako isti uopšte
ugleda svetlost dana), ostaje da se vidi… Aquamark 3 Commercial Plus Novi benchmark program karakterističan po velikom broju mogućnosti za testiranje
mogućnosti Direct X 7, 8 i 9 kompatibilnih video kartica. Koristili smo maksimalan
nivo detalja, test se izvršava bez zvuka, a anisotropic i antialiasing filteri
su bili isključeni. Dat je prosečan broj frejmova u svih devet testova.
Ogroman napredak kada su u pitanju optimizacije u drajverima – svakako pomažu
nVidia FX5950 Ultra kartici da se odvoji od svog prethodnika koji koristi starije
Detonator upravljačke programe, ali u većini slučajeva i od glavnog konkurenta. ForceWare protiv Detonatora
Da li je u pitanju pomenuti patch? Ko je u pravu, nVidia ili FutureMark? Ne želimo
da zalazimo u detalje, ali eto, postoje slučajevi u kojima je ForceWare nepoželjno
instalirati. Ako je samo zbog ovog programa…
…a to svakako nije. Upoređivanje screenshotova pokazuje da je kvalitet slike
sa oba drajvera identičan!
Zahtevni modovi Antialiasing
Anisotropic, Quality filter
Kombinovani modovi
Kao i ranije, u Antialiasing algoritmima, ATI kartice se ponašaju daleko bolje,
dok je nVidia marginalno brža u situacijama kada je primenjen Anisotropic filtering.
Overclocking S obzirom na to da je nV38 identičan nV35 GPU-u, a da je korišteno istovetno hlađenje,
očekujemo da se kartica koja je zvezda ovog testa može ubrzati slično ili nešto
bolje od Microstarovog GeForce FX 5900 Ultra modela. U startu, podešena na 475
/ 950 MHz, ima radnu temperaturu od 47 do 51 stepen celzijusa. Overheating warning
(threshold) je podešen na čitavih 120 stepeni, međutim, ovu temperaturu kartica
ne postiže ni prilikom maksimalnog overklokinga, što znači da bi na propisanih
475 / 950 MHz radila i u zatvorenom, neprovetrenom i samim tim i zagrejanom, malom
kućištu. Iako smo tajno očekivali više, postigli smo solidnih 530 MHz za jezgro
i 1040 MHz za memoriju. Zapravo, isprva smo pomislili da kartica može da radi
i na 580 / 1120, što se pokazalo kao nestabilno, ali tek posle nekih 10 minuta
igranja. Posle toga je sve do 540 / 1050 MHz, kartica pokazivala znake nestabilnosti,
ali smo ipak kao maksimalno stabilnu varijantu za testiranje, uzeli podešavanje
od 530 / 1040 MHz. To je 55% ili oko 13% ubrzanja za jezgro i oko 12% za memoriju.
I Microstarov Commander nivo u odlično osmišljenom Dynamic Overclocking Technology,
podrazumeva maksimalnih 10% ubrzanja za jezgro i memoriju, što je vrlo dobro,
jer temperatura u većini kućišta neće biti dovoljno visoka da se kartica uspori,
a ako se to desi, znači da je dostignuto 100 stepeni celzijusa na površini jezgra.
Zaključak GeForce FX 5950 Ultra je sjajna high performance kartica, koju sada ljubitelji
kompanije nVidia slobodno mogu pazariti i biti zadovoljni. U odnosu na Radeon
9800XT, neće izgubiti gotovo ništa, a uštedeće novac. Da, upravo tako. U kompaniji
nVidia je odlučeno da se i high end, a pogotovo mainstream modeli (FX 5700 Ultra)
ponude po veoma konkurentnim cenama. Tako je FX 5950 Ultra preuzeo trenutnu cenu
FX 5900 Ultra modela koji je već neko vreme na tržištu, dok FX 5700 Ultra košta
koliko donedavno i neki bolji FX 5600 Ultra. ForceWare drajveri su sve bolji,
a ljude sve manje interesuju rezultati u test programima, već više kvalitet prikaza
u igrama, kompatibilnost i kvalitet drajvera, te napredne mogućnosti i dodatne
opcije. Skoro da je i sam izgled kartice postao bitniji od nekoliko procenata
prednosti ili zaostatka; da ne govorimo o taborima i navijačima koji stoje iza
kanadske crvene ili američke, zelene zastave. Trenutno, ATI i dalje ima prednost,
koja je sve manja što se više jeftinijih FX 5950 i 5700 kartica bude pojavilo.
Optimizacija, reč koja i dalje ima lošu reputaciju, termin je koji treba upamtiti
i ne treba shvatiti olako. Ono što smo mi videli i iskusili tokom testiranja Microstar
GeForce FX 5950 Ultra kartice, može se svesti pod rečenicu: konačno – brže, tiše,
lepše i jeftinije.
Karticu smo na test dobili od korporacije Microstar.
Zahvaljujemo i distributeru MSI kartica, firmi Pakom Computers.