nVidia GeForce 6800 Ultra - MSI

nVidia GeForce 6800 Ultra - MSI

GeForce 6800 Ultra mnogi nazivaju najmoćnijim akceleratorom današnjice. Detaljno smo testirali MSI NX6800 Ultra i proverili te tvrdnje, a test potkrepili sa velikim brojem tehničkih detalja koje smo dobili od kompanije nVidia. Verujemo da će vam biti zanimljivo da ispratite novine i pogledate performanse koje je pružio revolucionarni nV40 GPU

    Sadržaj

      Branko Maksimović

      Uvod

      Verovali ili ne, najteže je napisati uvodnu reč. Ako želimo da se postavimo u
      kožu čitalaca, na pamet nam padnu i oni koji na kratku priču o tome šta se zbivalo
      od kako se pojavio prvi GeForce ili prvi akcelerator koji je radio sa FP brojevima,
      gledaju kao na malu uvredu – ako prate Benchmark, naravno da im je sve to već
      poznato. Tu su i mladi čitaoci, ili oni koji od nedavno prate ovu granu IT industrije.
      Ni njima ne možemo pokazati test ELSA GeForce 256 kartice i reći im da pročitaju
      narednih pedesetak… Ne želimo ni da se pravdamo, uvodnik bi, pored eventualnog
      pogleda unazad, trebalo da sadrži i deo impresije novim hardverom, preliminarni
      deo koji polako priprema čitaoca na cifre od blizu 13000 poena u (ne)popularnom
      testu iz 2003. godine. Uvodni tekst koji pokazuje da se povratak kralja ne dešava
      samo u Tolkinovim knjigama, za referentnu tačku može uzeti četvrti maj tekuće
      godine, kada je istekao NDA za R420 bazirane akceleratore. Kao mnogi već znaju,
      prve GeForce 6800 testove smo mogli da čitamo i mesec dana ranije. Mnogi su sa
      nevericom posmatrali cifre koje pokazuju dvostruko više rezultate nove kartice,
      u odnosu na najjačeg predstavnika prethodne generacije (u Futuremarkovom testu).
      A onda je predstavljen X800 XT, koji je, takođe, ispunio sva očekivanja, ali i
      pokazao da R420, osim 3Dc kompresije (normal mapa), ne donosi mnogo toga novog.
      Nasuprot tome, nV40 je zaista novi, drugačiji i svakako daleko moćniji GPU od
      bilo kog čipa iz Cine FX 2.0 familije. nVidia je imala još jedan kec u rukavu
      – ForceWare drajveri serije 61 su doneli ogromnu brzinsku prednost u odnosu na
      najpopularnije verzije serija 56 i 60, i to ne samo u 3D ili AquaMarku, već i
      u ogromnom broju igara (UT2004, FarCry 1.1, Call of Duty i mnoge druge), što ukazuje
      na dosledne optimizacije. Drajveri su ostali stabilni, kompaktni, a panelu je
      dodat određen broj novih opcija, tako da je potpuno nepotrebno koristiti programčiće
      tipa RivaTuner ili GTU. Najvažnija je mogućnost da se optimizacije trilinearnog
      filtriranja isključe, ali nVidia tvrdi da je razliku nemoguće primetiti tokom
      igranja. U našem iskustvu, razlika u performansama se kreće od 2% u Shader intenzivnim
      naslovima, do čak 12% u visokim rezolucijama i starijim igrama koje koriste klasično
      multiteksturisanje i tzv. fiksne funkcije (Jedi Knight, MOHAA, Call of Duty),
      dok je razlika uočljiva jedino kada se uključi mod koji različitim nivoima osnovnim
      bojama obeležava mip nivoe. nVidia tvrdi da i ATI koristi ove optimizacije i u
      High Quality modu, a da drajver poseduje detekciju mipmap coloringa (ovakav test
      postoji u Serious Sam-u ili 3DMark programu), te tada sam isključuje optimizaciju.
      Takođe, novi drajveri (prvo 61.11, a onda i 63.34, kao WHQL kandidat) su upravo
      učinili da GeForce 6800 Ultra preuzme vodstvo od X800 XT (koju smo takođe već
      testirali) u većini igara i benchmark programa. Situacija bi bila znatno drugačija
      da smo ranije testirali nV40, uz pomoć upravljačkih programa FW verzije 56.xx.
      Još jedan kec u rukavu za nVidiu može biti i Direct X 9.0c, kada će konačno i
      Pixel Shader 3.0 mogućnosti novog monstruma doći do izražaja.

      nV40 jeste predstavljen tridesetak dana pre nego što je ATI odgovorio sa R420,
      međutim, čak dva meseca je bilo potrebno da ove kartice uđu u proizvodnju, da
      bi nam proizvođači poslali sempl kartice. Tako su nam stigli modeli sa potpisima
      kompanija Microstar, Gainward i Leadtek. Čipove sa 16 pipeline jedinica nije
      jednostavno proizvesti, pa je i X800 XT kasnio u odnosu na nV40 Ultra modele
      – X800 Pro, podsetićemo, koristi R420 sa 12 aktiviranih pipeline jedinica.

      nV40 je svakako impresivan video procesor, ali bi možda i delovao manje revolucionarno,
      da su nV30, nV35 i nV38 bili projektovani drugačije. Nije bilo potrebno da FX5800,
      5900 i 5950 budu napredniji u nekom evolutivnom smislu, već samo drugačije organizovani.
      Šta je bilo loše kod ovih GPU-ova? Pipeline jedinice, odnosno video procesor kao
      takav, ima zadatak da da informaciju o boji svakog piksela koji će u određenom
      trenutku biti iscrtan na ekranu. Kako najjači predstavnici CineFX i CineFX 2.0
      generacije imaju četiri ovakve jedinice sa po dva potprocesora za teksturisanje
      (TMU), jasno je da u ciklusu mogu da iscrtaju ukupno osam piksela, ali sa dve
      različite teksture. Međutim, ovo je moguće samo u slučaju igara koje imaju tzv.
      fiksne funkcije i čiji je engine realizovan tako da na objekat postavlja osnovne,
      color mape, a onda i teksture osvetljenja (detaljne teksture, refleksije okoline,
      senke ili neravnine) “preko” nje. Ovakvi engine-i su bili u široj upotrebi u vremenu
      kada je nV30 razvijan, ali je mnoštvo izdavačkih kuća najavljivalo i nove igre
      bazirane na njima.U pitanju su starije igre koje se ne oslanjaju na upotrebu kompleksnijih
      Shadera, i koriste klasično multiteksturisanje, pa je za njihovo brže izvršavanje
      pogodnija 4 x 2 arhitektura. Nažalost po nVidiu, već u to vreme su počeli da se
      pojavljuju naslovi koji se ne obraćaju kompajleru, a ovaj grafičkom čipu na nivou
      pipeline-a, nego Shader jedinice, koja onda svaku scenu tretira kao single-teksturisanu.
      Drugim rečima, efekat osvetljenja, refleksije, prozirnosti ili neravnine se kalkuliše
      na nivou piksela, a ne teksture. U ovim situacijama, nV35 i 38 ne mogu da iskoriste
      obe teksturne jedinice po pipeline-u, te tako polovina fill-rate-a iz specifikacije
      ostaje praktično neiskorištena. Celu priču smo maksimalno pojednostavili, da ne
      bi dublje zalazili u tematiku. Na kraju krajeva, ne želimo da pričamo o nečemu
      što i nVidia želi da zaboravi.

      Možemo se, samo još ovaj put, podsetiti i trenutka kada su ljudi iz nVidie
      “napali” tvorce 3DMark programa, kada je verzija 03 ugledala svetlost dana.
      Davali su izjave kako 3DMark03 jednostavno ne simulira aplikacije na realan
      način, zbog toga što ne koristi multitexturing. Nažalost, Finci su bili u pravu
      – osim još uvek aktuelnih igara kakvi su Call of Duty (priprema se i nastavak
      na istoj softverskoj osnovi) ili Jedi Academy, nema novih naslova koji se oslanjaju
      na multiteksturisanje. Upravo zbog svega gore navedenog, bilo je logično za
      očekivati da će nV40 biti grafički procesor sa barem dvanaest pipeline jedinica
      sa po jednim TMU-om. nVidia je odlučila da uzvrati udarac i povrati poverenje,
      ali i podigne imidž kompanije, uči na starim greškama i pravi bolje promišljene
      poteze. Tako je odlučeno da najjači modeli nove serije grafičkih kartica imaju
      čak šesnaest pipeline jedinica, čak i po ceni obaranja radnih frekvencija i
      ponovnog druženja sa ekstremnim rashladnim sistemima. Ovakva politika se isplatila,
      ovoga puta…

      Nije mala stvar…

      napraviti procesor koji na silicijumsku “pločicu” površine oko 300 kvadratnih
      milimetara integriše 222 miliona tranzistora. Jezgro nema klasičan heat-spreader,
      ali je njegova površina veoma glatka. Procesor je izveden na pločicu dimenzija
      40 x 40 milimetara, pinovi su, prirodno, smešteni ispod, po Ball Grid Array standardu.
      Pogledajmo tabelu:

       
      ATI
      RADEON X800 XT Platinum Edition
      ATI
      RADEON 9800 XT
      NVIDIA
      GeForce 6800 Ultra
      NVIDIA
      GeForce FX 5950 Ultra

      Tehnološki
      proces
      130
      nanometarski low-k
      150
      nanometarski low-k
      130
      nanometarski
      130
      nanometarski

      Broj
      osnovnih poluprovodničkih elemenata
      160
      miliona
      110
      miliona
      220
      miliona
      125
      miliona

      Radna
      frekvencija GPU-a
      520
      MHz
      412
      MHz
      400
      MHz
      475
      MHz

      Memorijska
      magistrala
      256-bit
      DDR / DDR2 / GDDR3 SDRAM
      256-bit
      DDR / DDR2 SDRAM
      256-bit
      DDR / DDR2 / GDDR3 SDRAM
      256-bit
      DDR SDRAM

      Radna
      frekvencija memorije / maksimalna količina
      560
      MHz (1120 DDR) / 512 MB
      365
      MHz (730 DDR) / 256 MB
      550
      MHz (1100 DDR) / 512 MB
      475
      MHz (950 DDR) / 256 MB

      Memorijski
      propusni opseg
      33.4
      GB/s
      21.8
      GB/s
      32.8
      GB/s
      28.3
      GB/s

      Interfejs
      AGP
      3.0 4x/8x
      AGP
      3.0 4x/8x
      AGP
      3.0 4x/8x
      AGP
      3.0 4x/8x

      Pixel
      Shader
      2.x
      2.0
      3.0
      2.x

      Statički loop i grananje
      da
      ne
      da
      ne

      Dinamički
      loop i grananje
      ne
      ne
      da
      ne

      Multiple
      Render Targets
      da
      da
      da
      ne

      Floating-Point
      Render Target
      da
      da
      da
      ne

      Najveći
      broj teksela po “kloku”
      16
      8
      16
      4

      Najveći
      broj obrađenih Z vrednosti po ciklusu
      16
      8
      32
      8

      Broj
      teksturnih semplova
      16
      8
      16
      8

      Najviši
      nivo anizo filtera
      16
      x
      16
      x
      16
      x
      8
      x

      Vertex
      Shader
      2.0
      2.0
      3.0
      2.x

      Broj
      Vertex jedinica
      6
      4
      6
      3

      Statički loop i grananje
      da
      da
      da
      da

      Dinamički
      loop i grananje
      ne
      ne
      da
      da

      Čitanje
      tekstura iz vertex shader-a
      ne
      ne
      da
      ne

      Antialiasing
      algoritmi
      Rotated-grid
      multi-sampling,
      temporal anti-aliasing
      Rotated-grid
      multi-sampling
      Ordered-grid
      super-sampling,
      Rotated-grid multi-sampling,
      super-sampling + multi-sampling
      Super-sampling,
      multi-sampling,
      ordered-grid super-sampling + multi-sampling

      Maksimalni
      nivo antialiasinga
      2,
      4, 6
      2,
      4, 6
      2
      do 8 (sa kombinovanim modovima)
      2
      do 8 (sa kombinovanim modovima)

      Hidden
      Surface Removal (HSR)
      da
      da
      da
      da

      Texture,
      Z-buffer, frame buffer compression
      da
      da
      da
      da

      Fast
      Z-buffer clear
      da
      da
      da
      da

      Očekujemo da će većina 6800 Ultra kartica moći da se overklokuje do 450 MHz za
      jezgro i do barem efektivnih 1200 MHz za memoriju. Ovih 50 MHz ubrzanja mnogo
      znače nV40 platformi, što smo mogli da vidimo testirajući Gainward karticu sa
      vodenim hlađenjem na Ultra Extreme frekvencijama (475 / 1200 MHz). Potrebno je
      da prođe malo vremena, kako bi se proizvodni proces usavršio. Vremenom može doći
      i do malih korekcija na referentnom PCB-u (od strane proizvođača), ali će za korektno
      hlađenje i dobar overkloking i dalje biti potreban masivan i kvalitetno izveden
      kuler. Verovatno je mnogima već poznato da nVidia preporučuje napajanje od 480
      W za GeForce 6800 Ultra kartice. U pitanju je predostrožnost: u kompaniji ispravno
      razmišljaju, te su došli do zaključka da mnogi korisnici koji bi sada kupili ovakvu
      karticu imaju veoma moćnu ali i struje gladnu konfiguraciju. Za ovakve sisteme,
      standardna su dva hard diska, dva IDE uređaja, ploča sa overklokovanim procesorom
      (poslednja generacija iz Intela i AMD-a “vuče” oko 100 W), te veliki broj periferija
      itd. Jasno je da ovakvi sistemi za sebe rezervišu dobar procenat snage PSU-a (Power
      Supply Unit), te nVidia ne želi da korisnik koji je ranije imao FX5900 ili neki
      Radeon pazari novi nV40 i zaključi kako radi nestabilno. Pored toga, jeftina kućišta
      obično imaju napajanja deklarisana na 300 ili 350 W, koja nažalost, realno imaju
      tek od 60 do 70% te snage. Skuplja i kvalitetnija napajanja deklarisana i na 360
      W, dobro će poslužiti u sistemu sa GeForce 6800 Ultra karticom, barem ako gledamo
      naša i iskustva kolega iz zemlje i inostranstva.

      GeForce 6800 familija

      nVidia GeForce 6800 Ultra je najjači predstavnik CineFX 3.0 familije kartica,
      ako ne računamo ograničenu seriju Ultra Extreme predstavnika. Core je predviđen
      da radi na 400 MHz, a 256 MB GDDR3 memorije na 550 MHz (ef. 1100 MHz). Kako
      ima 16 pixel pipeline jedinica, svaka sa po jednim TM Unit-om, teoretski, fillrate
      je niži u odnosu na Radeon X800 XT, čije jezgro radi na 520 MHz u startu. Za
      razliku od situacije kod prethodne generacije, sada najbrži ATI GPU radi na
      višim frekvencijama od najbržeg GeForce čipa. Tada stečeno iskustvo nam nagoveštava
      da to ne mora da znači i brži finalni proizvod.

      GeForce 6800 GT koristi isti GPU i PCB, ali i single slot hlađenje. nV40 je podešen
      na 350 MHz, a GDDR3 memorija (256 MB) na 500 (1000 DDR) MHz, pa je na kartici
      prisutan samo jedan molex konektor. Tu su i jeftiniji, i po deklaraciji nešto
      sporiji Samsung memorijski čipovi (2 ns, u odnosu na 1.6 ns kod Ultre). Ova kartica
      bi u prodaji trebalo da košta nekih 90 do 100 evra manje od najskupljeg i najbržeg
      modela, a po prvim testovima, može se odlično overklokovati (do nivoa Ultre).
      Iako ne volimo da donosimo rane zaključke, mislimo da će 6800 GT biti vrlo uspešan
      proizvod, pogotovo u kasnijoj fazi proizvodnje, kada i Samsung (GDDR3 memorija)
      i IBM (nV40) usavrše svoje proizvodne procese.

      GeForce 6800 je izrađen oko nV40 GPU-a, ali sa nešto drugačijom štampanom pločom.
      U grafičkom čipu je isključen jedan Quad Pipe Unit, odnosno jedna četvrtina od
      ukupno 16 pipeline jedinica. Radna frekvencija jezgra je smanjena na 325 MHz i
      predviđena je regularna DDR memorija koja može da radi na standardnih 350 (700
      DDR) MHz. Proizvođači će se najverovatnije odlučiti za kvalitetne čipove od 2.8
      ns, dok se možda na nekom modelu namenjenom za overkloking, mogu naći i DDR memorije
      sa latencijom od 2.2 ili 2.0 ns. I na kraju, evo zvanične specifikacije nV40 video
      procesora.

       
      CINEFX 3.0 SHADING ARCHITECTURE
      • Vertex Shaders
      ° Support for Microsoft DirectX 9.0
      Vertex Shader 3.0
      ° Displacement mapping
      ° Vertex frequency stream divider
      ° Infinite length vertex programs*
      • Pixel Shaders
      ° Support for DirectX 9.0 Pixel Shader 3.0
      ° Full pixel branching support
      ° Support for Multiple Render Targets
      (MRTs)
      ° Infinite length pixel programs*
      • Next-Generation Texture Engine
      ° Up to 16 textures per rendering pass
      ° Support for 16-bit floating point
      format and 32-bit floating point format
      ° Support for non-power of two textures
      ° Support for sRGB texture format for
      gamma textures
      ° DirectX and S3TC texture compression
      • Full 128-bit studio-quality floating point
      precision through the entire rendering
      pipeline with native hardware support for
      32bpp, 64bpp, and 128bpp rendering
      modes
      NVIDIA HIGH-PRECISION DYNAMIC-RANGE
      (HPDR) TECHNOLOGY
      • Full floating point support throughout
      entire pipeline
      • Floating point filtering improves the
      quality of images in motion
      • Floating point texturing drives new levels
      of clarity and image detail
      • Floating point frame buffer blending gives
      detail to special effects like motion blur
      and explosions
      • New rotated-grid antialiasing removes
      jagged edges for incredible edge quality
      INTELLISAMPLE 3.0 TECHNOLOGY
      • Advanced 16x anisotropic filtering
      • Blistering-fast antialiasing and
      compression performance
      • Support for advanced lossless compression
      algorithms for color, texture, and z-data at
      even higher resolutions and frame rates
      • Fast z-clear
      • High-resolution compression technology
      (HCT) increases performance at higher
      resolutions through advances in
      compression technology
      ULTRASHADOW II TECHNOLOGY
      • Designed to enhance the performance of
      shadow-intensive games, like id Software’s
      Doom III
      ADVANCED ENGINEERING
      • Over 220m transistors
      • Designed for PCI Express x16
      • Supports PCI Express high-speed
      interconnect (HSI) technology for
      bidirectional interconnect protocol
      conversion
      • Full support of AGP 8X including Fast
      Writes and sideband addressing
      • Support for the industry’s fastest GDDR3
      memory
      • 256-bit advanced memory interface
      • 0.13 micron process technology
      • Advanced thermal management and
      thermal monitoring
      • 40 mmx40 mm, BGA flip-chip package
      ADVANCED VIDEO AND DISPLAY
      FUNCTIONALITY
      • Dedicated on-chip video processor
      • MPEG video encode and decode
      • WMV9 decode acceleration
      • Advanced adaptive de-interlacing
      • High-quality video scaling and filtering
      • Integrated NTSC/PAL TV encoder
      supporting resolutions up to 1024×768
      without the need for panning with built-in
      Macrovision copy protection
      • DVD and HDTV-ready MPEG-2 decoding up
      to 1920x1080i resolutions
      • Dual integrated 400 MHz RAMDACs for
      display resolutions up to and including
      2048×1536 at 85Hz.
      • Dual DVO ports for interfacing to external
      TMDS transmitters and external TV
      encoders
      • Microsoft® Video Mixing Renderer (VMR)
      supports multiple video windows with full
      video quality and features in each window
      • VIP 1.1 interface support for video-in
      function
      • Full NVIDIA® nView™ multi-display
      technology capability
      NVIDIA® DIGITAL VIBRANCE CONTROL™
      (DVC) 3.0
      • DVC color controls
      • DVC image sharpening controls
      OPERATING SYSTEMS
      • Windows XP
      • Windows ME
      • Windows 2000
      • Windows 9X
      • Macintosh OS, including OS X
      • Linux
      API SUPPORT
      • Complete DirectX support, including the
      latest version of Microsoft DirectX 9.0
      • Full OpenGL, including OpenGL 1.5

      CineFX 3.0 – Vertex Shader

      Za razliku od prethodnih generacija, CineFX 3.0 arhitektura procesora je osmišljena
      tako da se i u postojećim čipovima mogu onesposobiti delovi rendering pipeline-a,
      kako bi se dobio pogon za slabije modele. Isto tako, sada je mnogo lakše napraviti
      jednostavniji GPU, bez žrtvovanja ijednog feature-a koji ima najjači model.
      nV40 ima 16 pipeline jedinice, koje su, slično kao kod konkurenta, organizovane
      u četiri Quad Unita (2 x 2), svaki sa po jednim Texture Management potprocesorom.
      Tu je i šest Vertex Shader koprocesora. I po prvoj shemi, jasno je da se nova
      arhitektura dosta razlikuje od prethodne. nVidia označava ovu arhitekturu kao
      16 x 1 ili 32 x 0, što u prevodu znači da nV40 procesira 16 piksela po kloku
      sa informacijom o boji i Z vrednosti, ili 32 piksela po kloku, samo sa informacijom
      o dubini. Analogno tome, nV30, nV35 i nV38 su imali 4 x 2, odnosno 8 x 0 arhitekturu.
      Zbog čega nVidia uopšte daje ovakve informacije? U single textured 3D aplikacijama
      (većina scena u 3DMark03 i gotovo sve nove D3D igre), nV40 može da iscrta 16
      piksela po kloku (nV30, nV35 i nV38 mogu samo četiri), dok u multitexturing
      okruženju i nV40, i prethodnici mogu obojiti maksimalno po 8 piksela po kloku.
      Postoje i situacije pri kalkulisanju, recimo, senki, gde je bitna samo Z informacija
      (za Stancil Buffer) – kada nV40 može dati kalkulaciju za 32 piksela po kloku,
      dok nV30, nV35 i nV38 mogu samo osam. Postaje nam sve jasnije kako nV40 postiže
      toliko visoke rezultate, zar ne?
      Cine FX 3.0 – Vertex Shader

      Prethodne CineFX generacije GPU-ova su podržavale Vertex Shader verzije 2.0,
      FP32, 24, 16 i parcijalnu, takozvanu FX12 preciznost. Nažalost, FP32 kalkulacije,
      prethodnici su izvršavali dosta sporije od FP16 ili FX12, pa je puna preciznost
      potpuno isključena kao opcija. Naravno, to nije slučaj kod nV40, koji podržava
      Shader Model 3.0, odnosno Direct X 9.0c i nedavno apdejtovan OpenGL verzije
      1.5. Shader Model 3.0, nVidia je implementirala radeći blisko sa Microsoft-om.
      Ako se setimo, na implementaciji SM2.0, radili su ATI i Microsoft, dok je nVidia
      bila po strani. Stvari se, svakako, menjaju iz korena. Poznato je da je za Direct
      X 9.0c neophodna FP32 preciznost, koju ATI X800 ne podržava. Koliko vremena
      će biti potrebno da FP32 postane šire rasprostranjen, zavisi i od Microsofta,
      programera zabavnog softvera i nVidie. Ostaje pitanje i da li će mainstream
      i low end GPU-ovi iz nV4x familije imati SM3.0 kompatibilnost, ili će biti derivati
      prethodne generacije, sa nekim novinama pozajmljenim od nV40. Tech PDF koji
      nam je poslala nVidia, veoma je detaljan, ali ćemo se potruditi da čitaocima
      sažmemo ovo štivo i učinimo sve jednostavnijim. Postoji jedna teorija, koja
      kaže da će pisac svake naučno-popularne knjige prepoloviti broj potencijalnih
      čitalaca sa svakom narednom matematičkom formulom.

      nV40 ima šest VS jedinica. Prethodne su mogle da rade sa maksimalno 256 instrukcija
      (2^8), dok novi Vertex Shader razume i programe sa 65356 instrukcija, odnosno
      dva na šesnaesti (2^16). Vertex Shader u okviru nV40 ima i povećan broj privremenih
      registara (32). Mogućnost Shadera za Dynamic Flow Control je bila implementirana
      i u nV3x procesore, međutim, tadašnja verzija Direct X API-ja (9.0) nije bila
      u stanju da je adekvatno aktivira. Programeri sada mogu da pišu programe sa ogromnim
      brojem grananja i zaokreta, bez potrebe da GPU, recimo, radi preliminarne kalkulacije
      celog programa, samo da bi bio izvršen krajnji efekat. Ovako je jedan shader program
      dovoljno inteligentan da može sadržati informacije za primenjivanje više različitih
      efekata nad objektom, ili možda, informacije o osobinama materijala od koga je
      napravljen. Ovo je i dalje vrlo napredna SM3.0 mogućnost – programeri će još neko
      vreme radije pisati posebne, kratke shader programe za opisivanje svake mogućnosti,
      radi kompatibilnosti, iako je to u principu naporniji posao.

      Vertex Texture Fetch je dalje razrađivanje teme Displacement Mapping, koji podržava
      i konkurencija, a prvi je predstavio Matrox sa GPU-om Parhelia 512. ATI Radeon
      familija 9xxx i X800 podržavaju ovu funkciju preko n-Patches sistema. Ukratko
      ćemo podsetiti da se radi se o vrlo zanimljivoj mogućnosti da se jednostavan model
      obogati “geometrijom” pomoću mape koja sadrži informacije o visini piksela u odnosu
      na površinu objekta. Ostaje pitanje i da li će Displacement Mapping zaživeti sad
      kada je posao prebačen na Vertex Shader, koji direktno mapira informacije sa displacement
      mape na vertices u realnom vremenu. Iako se mnogima može učiniti da je tehnologija
      normal mapiranja naprednije rešenje, Displacement Mapping je pogodniji za bogato
      definisanje velikih terena, jer su monohromatske mape memorijski manje zahtevne
      i kada su velikim rezolucijama, za razliku od normal mapa, koje sadrže daleko
      veći broj (kolornih) informacija, te su i samim tim memorijski veće, ali pogodnije
      za definisanje manjih objekata.

      Geometry Instancing je mogućnost koju izvršava Vertex Frequency Stream Divider.
      Ona će biti korisna u scenama u kojima imamo ogroman broj istih ili „sličnih“
      objekata, kakve su 3D real time strategije. Geometry Instancing omogućava kreiranje
      duplikata objekata jednom komandom za svaki tip. Moguće je čak kreiranje i više
      različitih varijacija jednog objekta (recimo, isti model drveta, kome je jedna
      od osa duža ili kraća, kako bi se postigao efekat raznolikosti). Tako program
      pamti samo pozicije objekta, a GPU iscrtava isti tip (eventualno sa varijacijama)
      na te lokacije. Dobra strane ove mogućnosti je poprilična ušteda na memorijskom
      bandwidth-u, ali je loša što mora biti podržana od strane aplikacije.

      Cine FX 3.0 – Pixel Shader

      Već smo pomenuli koliko Pixel Shader jedinica ima novi nVidia GPU najviše klase
      i da “na” svakom postoji po jedan TMU. Takođe, može se reći da su iste razloge
      imali i nVidia i ATI da ove jedinice organizuju u četiri Quad Pipe celine. Procesor
      je tako skalabilniji, a pikseli koje obrađuje jedan Quad Pipe često imaju slične
      reference, pa bafer može da se deli, pogotovo u situacijama u kojima se generalno
      rade veće aproksimacije, kakve su igre sa fiksnim funkcijama ili jednostavnijim
      Shader programima. Svaki Quad Pipeline (pored četiri pipeline jedinice) ima
      i sopstvenu L1 keš memoriju. Tu je i L2 keš koji opslužuje ceo Pixel Shader.
      Nova, Superscalar arhitektura podrazumeva pravu SIMD logiku (Single Instruction
      Multiple Data), ali i dve ALU jedinice po pipeline-u. Prva uvek radi kopiranje
      i normalizaciju teksture, druga na njoj već radi Shading operacije. Ako imamo,
      recimo, shader program koji zahteva četiri aritmetičke operacije i jednu teksturnu,
      tada će jedan ALU u okviru prethodnih GeForce čipova moći da izvrši prvo 80%
      (od ukupnog posla) jedne vrste kalkulacija, a zatim ponovo pročita informacije
      iz teksture i odradi ostalih 20% (druge vrste kalkulacije). Superscalar arhitektura
      podrazumeva da drugi ALU radi teksturne operacije za sve vreme dok prvi ALU
      radi aritmetičke (i onda ga “sačeka“). U nekim drugim situacijama (50 : 50%),
      ušteda je daleko veća.


      tradicionalna arhitektura
      pixel shadera(CineFX, CineFX 2.0)

      superscalar arhitektura (CineFX
      3.0)

      Pixel Shader 2.0 je ograničen na svega 96 instrukcija po programu, dok PS3.0
      podrazumeva 65356 instrukcija kao maksimum. Ovo omogućava da se programi koji
      su ranije deljeni izvršavaju daleko brže, ali omogućava i pisanje daleko kompleksnijih
      shadera (realističnije osvetljenje, senčenje, materijali). CineFX 2.0 akceleratori
      su podržavali do 512 instrukcija, zbog čega je nVidia “definisala“ Pixel Shader
      2.0a. Sličan je slučaj i sada, jer nV40 podržava praktično “beskonačan” broj
      instrukcija, ali ga SM3.0 ograničava na 65356. Tako nVidia može da tvrdi da
      njihov novi GPU prevazilazi Direct X 9.0c specifikaciju. Shader Model 3.0 zahteva
      FP32 preciznost, koju su podržavali i nV3x GPU-ovi, dok SM 2.0 zahteva minimalno
      FP24. Iako je Vertex Shader kod prethodne CineFX generacije podržavao Dynamic
      Flow Control, tek je sada ova funkcija implementirana u Pixel Shader.

      Multiple Render Targets je funkcija koju je konkurent predstavio na prethodnoj
      generaciji video akceleratora. Radi se o funkciji koja upisuje informacije o već
      izvršenim kalkulacijama, u posebne bafere, te ih posle samo apdejtuje na druge
      objekte. Iako se kalkulacije ponovo izvršavaju, upisivanje istih delova koda se
      preskače, i time štedi na vremenu. Ova mogućnost je vrlo korisna pri kalkulaciji
      senki iz više različitih svetlosnih izvora.

       

       

      GasStation Demo – iz vremena
      CineFX 2.0 akceleratora, primer za Multiple Render Targets

      Da bi sirova snaga Pixel Shader jedinica bila veća, broj konstantnih i privremenih,
      kao i specijalizovanih registara je morao biti povećan. Mali broj registara i
      njihova neadekvatna organizacija, najveći su krivci za sporost izvršavanja Shadera
      na GeForce FX karticama. Centroid Sampling je, recimo, jedna od novih funkcija,
      koja ispravlja nedosledno umekšavanje ivica u pojedinim, novijim igrama koje koriste
      takozvane “packed” teksture. Kada osnovni deo površine objekta biva teksturisan
      pikselom ili grupom piksela koji (bojom) ne odgovaraju toj strani objekta (referenca
      za popunjavanje ivica može biti uzeta sa površine koja se i ne vidi u tom trenutku).
      Tada Centroid Sampling uzima grupu piksela iz centra semplovane površine, na koju
      procesira umekšavanje. Flexible Data Type Support je naziv za mogućnost nV40 GPU-a
      za nativni FP16 ili FP32. Dakle, ako aplikacija podržava samo FP16, GPU neće raditi
      u FP32 režimu i trošiti resurse. nVidia tvrdi da nV40 jednako dobro radi u FP32
      i FP16 modu, te da je razlika u performansama zaista minimalna. Pixel Shader 3.0
      omogućava programerima i dizajnerima zabavnog softvera da na jednostavan način
      implementiraju Subsurface Scattering. Ova funkcija je korisna za generisanje materijala
      na površinama objekata, koji imaju volumen i debljinu.

      Tu su i meke senke, kao i Enviroinmental i Ground senke, koje kreiraju objekti
      kao što je brdo ili veća zgrada, i bez smanjenja performansi. Ove senke se realizuju
      u stancil buffer-u, tako da više nema potrebe za klasičnim shadow mapama, Env.
      i Ground Shadows se takođe kalkulišu realno i u odnosu na globalni izvor svetlosti
      (kao što je Sunce). Tu je i primer za Global Ilumination: Pixel Shader program
      opisuje objekat sastavljen od debelog materijala (praktično njime ispunjen) određene
      boje i prozračnosti. Onda je samo potrebno postaviti određen tip svetlosnog izvora
      unutar nejga…

      Ultra Shadow II

      O ovoj tehnologiji smo već pisali pri predstavljanju GeForce FX 5900 Ultra modela.
      Kod kalkulisanja senki, potrebna je samo Z Stencil informacija, pa se nV40 ponaša
      kao 32 x 0 akcelerator, odnosno može da iscrta 32 piksela po kloku. U igrama kao
      što je Doom III, postoji ogroman broj objekata i različitih svetlosnih izvora,
      a samim tim i ogroman broj različitih senki.

      Igra je, sama po sebi, veoma mračna i možete onda predpostaviti koliko se senki
      preklapa. Naravno, i tada svaka senka mora imati svoj realan oblik, ali šta je
      sa onim senkama koje već “padaju” u one koje su veće i tamnije? Tada na scenu
      stupa UltraShadow II, koji je do četiri puta brži od prethodnog sistema (svakako,
      kada je i sam nV40 znatno brži akcelerator).

      Ovaj sistem kalkuliše koji objekti (i svetlosni izvori) izlaze iza granice
      (depth bound), i na koje određen broj svetlosnih izvora neće uticati. Konačan
      rezultat je scena koja isto izgleda, a za koju je bilo potrebno izvršiti daleko
      manji broj kalkulacija.


       

       

      Samo RGB nije dovoljno…

      Prethodna generacija nVidia grafičkih procesora nije podržavala Multiple Render
      Targets, dok ATI čipovi, počev od Radeona 9700, jesu. nV40 podržava i MRT i
      FP Render Target, pa tako i omogućava kreiranje scena sa HDR slikama, scene
      koje imaju High Precision Dynamic Light Range.

      RGB model, kreiran za klasične CRT monitore omogućava svakoj od osnovnih boja
      da ima 256 nivoa osvetljenja, odnosno od 0..255 nivoa sive, gde je nula apsolutno
      crna (0, 0, 0 : R,G,B), a 255 apsolutno bela “boja” (255, 255, 255). Broj 256
      je 2 ^ 8 što odgovara jednom bajtu. Kombinovano sa tri osnovne boje, dobijamo
      256 x 256 x 256 nijansi = 16.7 miliona, što može izgledati dovoljno. Svaka nijansa
      je opisana integer vrednošću, pa kada shader prosledi informaciju o nivou osvetljenja
      piksela od 2.43 ili 53.7, dolazi do aproksimacije, odnsono zaokruživanje na integer
      vrednost.

      Definicija osvetljenja od osam bita je nedovoljno i za klasične CRT monitore,
      koji imaju osvetljenje od 100 do 140 kandela po metru kvadratnom. Ako srednju
      vrednost osvetljenja podelimo sa 256 nivoa sive, dobijamo vrednost od oko 0.465
      cd/m*m između dva susedna nivoa osvetljenja, u slučaju da je osvetljenje monitora
      podešeno na maksimum. Ljudsko oko može u isto vreme da vidi razliku između 10
      nijansi osvetljenja i 10 hiljada kolornih nivoa , što zajedno čini broj od 10
      ^ 8 boja.

      Tako je jasno da nijedan monitor ne može da pokrije broj nijansi i nivoa osvetljenja
      iz realnosti. Ali, prikaz osvetljenja može biti realniji ako se napusti klasičan
      RGB model. Grafička kartica može da prosledi informacije o nivou osvetljenosti
      piksela u FP formatu, a onda monitor jednostavno prikazuje onolike razlike u nivoima
      koje je fizički sposoban da prikaže. Da li je poboljšanje vidljivo na prvi pogled?
      Svakako da jeste.


      Scena renderovana po standardnom
      modelu

      Scena renderovana po OpenEXR
      color modelu

      HDRI (High Dynamic Range Images) model je nezavistan od ograničenja bilo kakvog
      hardvera ili medija, ali HPDR sistem implementiran u nV40 mora “biti svestan”
      ograničenja koje nudi RGB. Tako se prevođenje sa HDR modela na Low Dynamic Range
      model vrši preko Tone Mapping algoritama. No, kalkulacije po čistom HDRI modelu
      bi bile praktično nemoguće u realnom vremenu, pre svega zbog ograničenja samog
      hardvera. Zbog toga se nVidia odlučila za kompromisni model, 16-bitni OpenEXR,
      koji je razvila kompanija filmskog maga Džordža Lukasa (Industrial Light &
      Magic). U poređenju sa sRGB ili RGB modelom, i OpenEXR je HDR model, jer koristi
      16-bita za opis kolornog kanala (10 bita za informaciju mantise i pet bitova
      za informaciju eksponenta). Kreiranje i prosleđivanje kalkulacija po ovom modelu
      u nV40 procesoru se sastoji od tri koraka:
      Light Transport – procesiranje scene u HDR modelu i čuvanje podataka o svetlosnoj
      i kolornoj informaciji piksela u OpenEXR formatu
      Tone Mapping – konvertovanje HDR formata slike u LDR format pomoću pametnih
      algoritama (nažalost, do ovoga mora doći) – RGB ili sRGB.
      Color & Gamma Correction – dodatne korekcije vrše se u softveru i podešavaju
      za konkretni CRT ili LCD monitor.

      Intellisample 3.0

      ATI je predstavio Temporal Antialiasing, međutim, koliko će ova funkcija biti
      upotrebljivana u praksi, ostaje da se vidi. nVidia je sa prethodnom generacijom
      još uvek koristila kombinacije Supersampling i Multisampling algoritama, a dosta
      dobro su se pokazali i xS i Quincunx metode. Ovoga puta, inženjeri američke kompanije
      su malo prepisivali od kolega sa severa i implementirali već poznat metod rotacije
      grida za popunjavanje piksela na ivici objekta (rotated grid). Njihov ordered
      grid metod nije bio ništa zahtevniji, ali se pokazalo da rotated grid daje bolje
      rezultate. Naravno, najzahtevniji mod, osmostruki AA je i dalje kombinacija 4x
      rotated grid multisemplinga i 2x supersemplinga (uvećavanje rezolucije + downscaling).
      Kada je anisotropic u pitanju, i ovde ima novina, pa je 6800 Ultra prvi nVidia
      akcelerator koji nudi anizotropni mod filtriranja od 16 tap. O svemu smo više
      puta ranije pričali pa ćemo sada odmah preći na zanimljiviji deo:

      Video procesor

      Kod prethodnih generacija video akceleratora, ako ne računamo ATI-jev pokušaj
      da ulepša low bandwidth video sadržaj (Fullstream), 2D i Video engine je samo
      nudio osnovne kalkulacije kod procesiranja MPEG video sadržaja (dekoding). Te
      funkcije su skaliranje, filtriranje de-interlacing, de-blocking i podrška u vidu
      eksternog ili internog TV-enkodera. Ako video procesor može da procesira tako
      kompleksnu 3D grafiku, zbog čega ne bi imao i pokoji potprocesor posvećen obradi
      video signala. Uostalom, uvek nam je bilo smešno što u enkodovanju CD Audio materijala
      u MP3 ili WMA format ne učestvuje zvučna kartica u onoj meri u kojoj je to logično.
      Ista stvar je i sa dekodiranjem video materijala. Da ne bi CPU radio sve ovo,
      nVidia je implementirala neke korisne i vrlo moderne funkcije u nV40:

       
      • Support of adaptive de-interlacing;

      • High-quality scaling and filtering;
      • Removal of blocky artifacts;
      • Integrated TV-coder;
      • Inverse telecine (3:2 pulldown);
      • Conversion of color spaces;
      • Conversion of the refresh rate;
      • Gamma correction;
      • Noise cancellation;
      • Frame Rate Conversion
      • Processor amplifier;
      • HDTV support (720p, 1080i, 480p, CGMS modes are supported);
      • Hardware synchronization of audio and video streams;
      • Support of MPEG-1/2/4 encoding/decoding;
      • Support of WMV9H.264 decoding.
      • WMV9/H.264 motion compensation
      • WMV9/H.264 In-Loop deblocking
      • DiVX Decode/Encode
      • High Quality Scaling
      • Hardware Audio/Video Synchronization

      Video procesor koristi neke delove Pixel Pipeline jedinice, dok su neke celine
      posebno kreirane u ovu svrhu. NVidia tvrdi da dekodiranje MPEG2 materijala oslobađa
      resurse do 95%, dok enkodovanje oslobađa resurse do 60%.

      Dekodiranje MPEG2 materijala

      Zanimljivo je da i neki zaista kompleksni efekti mogu biti primenjeni na sam video
      u realnom vremenu. Neki od njih su do skoro bili rezervisane za skupe studijske
      video kartice, kakve proizvodi Matrox, na primer. Po našem mišljenju, veoma važna
      je i podrška za hardverski MPEG2 / 4 i WMV9 video enkoding i dekoding, kao i podrška
      za HDTV standard. Najlepše od svega je što je i video procesor programabilan,
      te se hardverska podrška za nove video standarde lako može dodati u novim revizijama
      drajvera.

      Enkodiranje MPEG2 materijala

      ForceWare 6x.xx – “Detonator” u formi

      ForceWare drajveri serije 6x.xx, koja je predstavljena paralelno sa promocijom
      nV40 čipa, nude zaista mnogo novih opcija. Pored mogućnosti totalne kontrole anizotropnih
      i trilinear optimizacija, tu su i nove olakšice i funkcije za Dual View rad: pametni
      kursori, one touch raspored ekrana, nove shortcut definicije, pop up block-eri
      za Internet Explorer sa naprednim podešavanjima (da, dobro ste pročitali) i zaista
      još dosta toga novog…

      Pored toga, NVidia insistira da se testovi rade sa Quality setovanjima u drajverima,
      kao i sa uključenim optimizacijama za trilinear i trilinear + anisotropic modove.
      Kako navode u tech. PDF fajlu, i ATI koristi ove optimizacije uvek, osim kada
      se koriste Colored MipMap nivoi, koji otkrivaju oštrije ivice između nivoa, što
      se teže primeti u igri. Evo i nekoliko rečenica iz tog fajla.
      Important:This
      optimization is always on for competitor’s hardware during normal use. The only
      time they do “full” trilinear is when colored mipmaps are enabled to show trilinear
      levels.

      Note:
      Some competitors implementations of "optimized" trilinear
      use texture analysis to effectively detect colored mipmap chains, and implement
      "full" trilinear in these cases where they are present. This can be
      misleading to a reviewer trying to determine where the optimization is applied.
      NVIDIA sees no reason to implement this behavior

      Important:
      Users should choose one of the above image settings based
      upon their
      preferences prior to selecting an antialiasing and anisotropic filtering setting.
      For GeForce 6800 Ultra and GT testing versus competitive GPUs, NVIDIA recommends
      setting Image Settings to Quality mode and leaving Trilinear Optimizations and
      Anisotropic Optimizations On. This will provide an apples-to-apples comparison
      versus the competition. Image Quality settings should contain similar levels
      of optimizations. When doing comparisons on GeForce 6800 versus competitor’s
      products, make sure the competitor’s settings are all set to their highest quality
      settings which contain optimizations. This setting should be compared to NVIDIA’s
      Quality setting which contain similar optimizations. NVIDIA’s Highest Quality
      setting contains no optimizations, and this mode is not offered by our competitors.
      Poređenje verzija

      U našem iskustvu, drajveri verzije 61.11, a pogotovo 61.34, doneli su zaista bitna
      ubrzanja i pokazali da nVidia zaista može da napravi fer optimizaciju. Evo primera
      iz jedne aplikacije:

      Trilinear vs. Brilinear

      Koliko utiče isključivanje trilinearnih optimizacija, koje, kao što ste gore pročitali,
      nVidia ne preporučuje? Pogledajmo tabelu:

      Kartica na testu


      Microstar je vrlo često najagilniji, jer kao najveći svetski proizvođač, ima
      odlične veze sa ATI i nVidia partnerima. Uz to, i saradnja našeg sajta sa ovom
      kompanijom je, kako se to u Srbiji kaže, “na nivou”, pa smo i mi dobili ekskluzivan
      primerak kao referentnu karticu u narednom periodu.
      MSI NX6800 Ultra dolazi u začuđujuće malom pakovanju (Microstar je konačno odlučio
      da malo povede računa o šumama u Amazoniji), koje sada ima regularne dimenzije,
      ali je napakovano do poslednjeg kubnog milimetra. Tu si igre kao što je URU: Ages
      Beyond Myst, Prince Of Persia: Sands of Time ili Cell Shaded hit – XIII. Tu je
      i Photoshop Album, pojednostavljena verzija Photoshop Elementsa, koji će se dopasti
      korisnicima ACDSee-a, Virtual Drive i RestoreIT, 5.1 verzija WinDVD programa,
      drajveri i utility programi kao što su LiveUpdate!, programčić koji omogućava
      dinamičko overklokovane – D.O.T (sada nVidia ima sličnu opciju u svojim regularnim
      drajverima). Ne treba zaboraviti i malo starije igre – Black Hawk Down, Comanche
      4, Joint Ops, Deus Ex Invisible War, IL-2 Sturmovik, Splinter Cell i još neke,
      kao i gomilu demoa… Skoro pa nam je MSI nadoknadio obećani Doom III (kada izađe,
      moguće je da će se naći u bundle-u).


      Prvi utisak o GeForce 6800 Ultra – kartica i nije toliko masivna koliko bi se
      moglo učiniti na slikama. Deluje lakše od većine FX 5950 Ultra modela. Sama kartica
      je izrađena prema referentnom nacrtu, što važi čak i za kuler. PCB je slične dužine
      kao i onaj kod FX5900 modela, ali sa znatno manje klasičnih elektrolitskih kondenzatora,
      koji su zamenjeni pasivno hlađenim MOSFET-ima.


      Sa osnovne strane, smešteno je 256 MB GDDR3 memorije koje je proizveo Samsung.
      Njihovo vreme latencije je fantastičnih 1.6 nanosekundi, što odgovara frekvenciji
      od efektivnih 1250 MHz. Na 1100 MHz, na koliko je podešena, memorijski čipovi
      ne oslobađaju veliku količinu toplote, ali je nVidia mislila i na ljude raspoložene
      da dodatno ubrzaju karticu, kao i na sisteme u slabije provetrenim kućištima,
      pa je i za memoriju obezbedila posebno hlađenje.


      Kuler se sastoji iz više delova: metalni profil, sastavljen od tankih listića
      aluminijuma, koji je specijalno ispoliran sa donje strane i sa glatkom površinom
      nV40 čipa “spojen“ kvalitetnom termalnom pastom, zatim G profil koji pokriva memorijske
      čipove, a koji ima i metalnu cev koja bolje raspoređuje toplotu, i na kraju centrifugalni
      ventilator sa tunelom, koji uvlači vazduh i usmerava ga prema metalnim profilima.


      Posebno pozdravljamo novi način montaže kulera – kod svih nV40 kartica, on je
      ušrafljen, te konačno možemo reći zbogom lošim plastičnim tiplovima. Kartica ima
      dva DVI konektora koji su vezani na novi Silicon Image procesor i jedan S-Video
      izlaz, čiji se enkoder nalazi u samom jezgru, što je tradicija koju nVidia gaji
      još od modela GeForce 4 MX. I naravno, tu su i dva molex konektora.


      Zanimljivo je i što MSI u listi na samoj kutiji zahteva napajanje od 350 W, dok
      nVidia preporučuje znatno jači model (480 W). Kartica radi zaista besprekorno,
      kuler nije preterano bučan (na nivou Radeon 9800 Pro modela, tiši od najtiših
      vazdušno hlađenih GeForce FX5950 kartica, ali opet bučnija od Radeona X800 XT…),
      a kvalitet slike impresionira, bez obzira što se koriste adapteri. No, većina
      zainteresovanih za NX6800 Ultra karticu verovatno ima odličan TFT monitor…


      Test Setup

      Kartice smo testirali na test sistemu prikazanom u tabeli:

      Procesor
      AMD Athlon XP 2400 MHz (fsb. 210MHz)

      Matična ploča
      Abit NF7-S v2.0
      – powered by Enermax 360W

      Memorija
      2x 512 MB DDR450 @
      6-2-2-2.5

      Hard Disk
      IBM DeskStar DTLA 120GXP
      "Death Star" 60 GB

      Video Karte
      GeForce FX5900 Ultra
      – 256 MB DDR – ForceWare 61.34
      Microstar Radeon 9800 Pro – 128 MB DDR Catalyst 4.5
      Microstar Radeon X800 Pro – 256 MB DDR Catalyst 4.5
      Microstar GeForce 6800 Ultra – 256 MB GDDR3 ForceWare 61.34

      Monitor
      Samsung SyncMaster
      959NF

      Cooling
      Thermaltake TT7+

      DVD uređaj
      Pioneer 116 DVD-ROM

      CDRW uređaj
      Sony CDRW Drive CRX220E1

      Operativni sistem

      Windows XP Service Pack 1 with XPLite! (optimized for performance)
      Direct X 9.0b

      Igre/Bench programi

      Quake 3 Arena v1.17
      Unreal Tournament 2003 v2166
      Unreal Tournament 2004 Demo
      FutureMark 3DMark 03 Professional
      Aquamark 3 Commercial Plus
      Activision Call of Duty
      Splinter Cell: Pandora Tomorrow
      Crytek FarCry 1.1
      ColinMcRae 4
      CodeCreatures Benchmark Demo
      SpecORG ViewSPEC Perf 7.1
      X2 – The Threat Rolling Demo Benchmark
      Microsoft Halo for PC Retail

      Napomene:
      NVidia insistira na još nekoliko stvari kada je testiranje u pitanju:
      The GeForce 6800 Ultra is a very powerful GPU. As a result
      some games run so fast on the GeForce 6800 Ultra, that the frame rate or score
      of the game/benchmark is actually limited by the CPU. Many games that were previously
      not considered CPU limited are now CPU limited when playing on a GeForce 6800
      GPU. To tell if your score is being CPU limited, vary the resolution/settings
      of the benchmark run and see if the score does not change. Examples of games
      that are mostly CPU limited when running on the GeForce 6800 GPUs include:
      XIII™, Call of Duty™ (when no AA is enabled), Comanche™, 4 Command & Conquer®:
      Generals™, Dungeon Siege™, Medal of Honor™, Microsoft® Flight Simulator™ 2004,
      Neverwinter Nights™, Quake™ III Arena, Serious Sam™: The Second Encounter (at
      1024×768 or lower), Wolfenstein™ – Enemy Territory (at 1024×768 or lower), Unreal
      Tournament™ 2003 (at 1024×768 or lower, or in botmatch), Warcraft3™

      NVIDIA recommends benchmarking the following applications and games to evaluate
      GeForce 6 Series GPUs: Aquamark3, 3DMark® 03, Call of Duty™, Far Cry™, Halo™:
      Combat Evolved, Serious Sam™: The Second Encounter, Star Wars® Jedi Knight®
      III: Jedi Academy™, Tom Clancy’s Splinter Cell™, Unreal Tournament™ 2004, Wolfenstein™
      – Enemy Territory, X2 – The Threat

      Sintetički benchmark programi ~ 3DMark 03 – #340

      Poslednja verzija 3DMark benchmark programa je pokazala i konačno dokazala kompaniji
      nVidia da je napravljena greška u proceni sa arhitekturom koja integriše dve TMU
      jedinice po pipeline-u. Ovaj program, iako kritikovan od strane mnogih, pokazao
      je i da se mora voditi računa o brzini izvršavanja Shader programa, te da je veoma
      zdravo ispoštovati do kraja DirectX 9 specifikaciju, odnosno napisati sopstveni
      kompajler da što bolje sarađuje sa HLSL prevodiocem Microsoftovog API-ja. 3DMark03
      je patch-ovan najnovijom zakrpom, a testirali smo na default setovanjima.

      Stravičnu prednost koju donosi GeForce 6800 Ultra, zahvaljujući novoj arhitekturi
      i 16 pipeline jedinica, lako je primetiti. Prednost je povećana i novim drajverima
      61.34 – koji u default rezoluciji donose blizu 1000 poena u odnosu na 56.72!

      Game testovi

      Direct X 7 test pokazuje da je nova kartica moćnija i u situacijama u kojima se
      ne koriste napredni shaderi. Pogledajte koliko je 6800 Ultra brža od prethodne
      nVidia generacije…

      Koliko će 6800 Ultra biti u prednosti u igrama tipa Doom III? Možda ovaj test
      to najbolje pokazuje…

      I ovde je prednost više nego očigledna. Zapamtite ove cifre, naredne nedelje će
      X800 XT pokušati da uzvrati udarac.

      Test koji ima mnogo Pixel Shader programa specifikacije 2.0. Ponovićemo da, na
      samom početku, kada “kamera” počinje da se diže sa vode na krajolik, broj frejmova
      na Radeon 9800 XT kartici pada na 14, kod GeForce FX 5900 na 7 do 9 fps, na modelu
      X800, je, u istom trenutku, bio zakucan na 28 fps, dok je kod GeForce 6800 Ultra
      kartice na nivou od oko 24 do 25 fps. Ipak, rezultati gore u tabeli pokazuju prosečan
      broj frejmova po sekundi. Jasno je da će ovde Radeon X800 XT doneti još veću prednost
      u odnosu na najjači GeForce.

      Zanima vas kako radi GeForce 6800 Ultra Extreme? Pogledajte, za sada, jednu tabelu…

      AquaMark Commercial Plus

      Novi benchmark program karakterističan po velikom broju feature-a za testiranje
      mogućnosti Direct X 7, 8 i 9 kompatibilnih video kartica. Koristili smo maksimalan
      nivo detalja, test se izvršava bez zvuka, a anisotropic i antialiasing filteri
      su bili isključeni. Nismo dali ukupan rezultat već prosečan frame rate po rezoluciji.

      GeForce 6800 Ultra je ovde pokazao prednost, mada nije toliko brži koliko bi možda
      trebalo. I svakako, u višim rezolucijama, nV40 nikako nije ograničen centralnim
      procesorom.

      CodeCult Codecreatures Standard Benchmark

      I dalje jedan od najlepših i najzahtevnijih testova koje koristimo je CodeCreatures
      Benchmark. Baziran je na engine-u koji koristi Shadere verzije 1.3 (Direct X 8),
      i odlično ukazuje na to kako se kartica snalazi sa teksturama veoma visoke rezolucije
      i velikom količinom poligona. Vizuelna atraktivnost i fotorealističnost su i po
      današnjim standardima na visokom nivou, ali je igra Far Cry definitivno za klasu
      nadmašila ovaj test, barem u vizuelnom aspektu. Default test se izvršava u tri
      rezolucije: 1024×768, 1280×1024 i 1600×1200. Moguće je kreirati batch u kome je
      ćete izabrati sopstvene modove od rezolucija 640*480 do najvišeg grafičkog moda
      koji kartica podržava.

      Sličan komentar može da se da i u ovom testu – X800 Pro daje sasvim zadovoljavajuće
      rezultate.

      SpecORG SpecView Perf 7.11

      SpecOPS-ov OpenGL test koji pred video kartu postavlja nešto drugačije zadatke
      nego što to čine poznate igre. Ovaj skup OpenGL programa testira specijalne funkcije
      neke 3D kartice, koje se koriste u profesionalnim i poluprofesionalnim 3D aplikacijama
      tipa CAD i 3D Modeling. Mi smo koristili smo poslednju aktuelnu verziju koji se
      sastoji od šest celina. Kao što već znate, u pitanju je karakterističan i za mnoge
      korisnike veoma važan test.

      Real Gaming testovi / OpenGL ~ Call of Duty retail

      Call of Duty je odlična single i multiplayer igra, bazirana na žestoko modifikovanom
      Quake III engine-u. Kako su nivoi i do trideset puta kompleksniji i veći, jasno
      je da su i rezultati koje akceleratori daju daleko niži. Precizniji i lakši benchmark
      donosi aplikacija CoD Bench, koja automatizuje proces testiranja. Poželjno je
      koristiti poslednju verziju igre, koja patchuje kako Single player, tako i Multiplayer
      verziju, sa kojom se inače i vrši testiranje. I ovoga puta, podešavanja su bila
      na apsolutnom maksimumu.

      Igra pokazuje realno stanje stvari i moć nove grafičke kartice američkog dizajnera
      video procesora. I dalje je pomalo nejasno zbog čega je GeForce FX 5900 dao toliko
      nizak rezultat, kada smo i njega "opremili" novom verzijom drajvera…

      Quake III Arena

      Jednom smo već napomenuli da će Quake sa spiska test programa istisnuti samo i
      jedino Doom III. Ako se to ne desi, zbog najavljene nemogućnosti za testiranje
      kroz ovu igru, verovatno će tu biti još neko vreme. Verzija sa kojom testiramo
      je standardna 1.17 sa x86 optimizovanim dll-ovima.

      Max Quality Setting:
      Teksture na najvišem nivou
      Geometrija na najvišem nivou
      Primenjeni: r_subdivisions 1 i r_lodError 0
      High Quality Sky
      Ejecting Bras uključen Sync Every frame isključen
      Lightmap lights
      Force Player Models isključen
      Dynamic Lights uključen
      Marks On Walls uključen
      Sound Quality low

      Naravno, sve kartice, a ponajviše GeForce 6800 Ultra, u ovom testu su ograničene
      samim procesorom. Opet se možemo našaliti: kada bi samo igrali Quake III i poželeli
      viši frejmrejt, očigledno bi morali da pređemo na brži sistem. 

      Real Gaming Testovi / Direct X 8 ~ Unreal Tournament
      2003

      Unreal Tournament 2003, patchovan na verziju 2166 u Direct3D izdanju. Testirali
      smo sa maksimalnim nivoom detalja, zvuk je bio podešen da zauzme što manje procesorske
      snage. Mapa koju smo koristili su flyby suntemple, sa odgovarajućim batchom u
      Benchmark direktorijumu. Ova mapa spada u jednu od najzahtevnijih u ovoj igri.

      Zanimljivo je da je ATI Radeon X800 Pro ovde pokazao brzinsku prednost, što je
      očigledno stvar verzije igre i drajvera. Sigurno je da GeForce 6800 Ultra u ovoj
      igri može postići daleko više rezultate…

      Splinter Cell Pandora Tomorrow

      Ova igra koristi modifikovanu verziju Unreal Tournament 2003 engine-a i u mnogo
      većoj meri se oslanja na shadere. Karakteriše je veliki broj poligona, kombinovan
      sa brojnim teksturama i dosta shader efekata (voda, stancil senke, post processing
      efekti). Testirali smo na najvišim mogućim setovanjima. Iako na mnogim mestima
      možete pročitati da je u pitanju Direct X 9 igra, Pandora Tomorrow ne koristi
      Shader Model 2.0 programe. I ovoga puta smo morali da koristimo eksterne skripte
      za testiranje.

      Pošto se radi o istom engine-u, jasno je da je problem u drajverima, koji će od
      najjače GeForce kartice izvući bar desetak procenata ubrzanja. Ili, možda, patch
      od ljudi koji su razvili ovu igru.

      Colin McRae 04

      Naš testbed je svakako zaslužio da mu se pridruži i jedna popularna simulacija
      reli vožnje. Ubedljivo najpopularnija i na ovim prostorima, jeste nova inkarnacija
      Colin McRae relija. Iako nije napredovala od prethodne, barem u čisto tehničkom
      aspektu, ova odlična igra je reprezentativan primer svog žanra, pa će mnoge zanimati
      kako se ponašaju novi video akceleratori u jednom ovakvom naslovu. Igra nema ugrađen
      benchmark mod, pa smo mi merenje u pauzi (koja daje rotaciju za 360 stepeni, sa
      fiksnim brojem frejmova) izvršili pomoću programa Fraps.

      ColinMcRae je oduvek brže radio na ATI karticama, pa nam je drago da vidimo preuzimanje
      vodstva barem u 16 x 1 prema 12 x 1 duelu…

      X2 – The Threat

      X2 – The Threat je igra koja je nedavno izašla i privukla pažnju raskošnom grafikom,
      karakteristična po detaljnim teksturama, svetlosnim efektima i particle sistemom.
      Koristi Direct X 8.1, iako inicijalno zahteva instaliranje verzije 9.0. Za testiranje
      nismo koristili retail verziju već rolling benchmark demo, mada i prava verzija
      ima benchmark mod. Grafika je bila podešena na maksimum, a zvuk isključen.

      Real Gaming Testovi / Direct X 9 ~ Unreal Tournament
      2004 Official Demo

      Unreal Tournament 2004 je izgrađen na sličnoj osnovi kao i naslov iz prethodne
      godine (uz intenzivniju upotrebu shadera). Ovoga puta koristimo demo ove igre,
      jer se daleko brže instalira i ima sve što je potrebno da bi se test uspešno izvršio.
      Nažalost, u demo verziji ne postoje Highest modovi za teksture i efekte, pa su
      samo geometrija i procesiranje modela podešeni na najviši nivo, dok je sve ostalo
      namešteno na Normal. I u ovom izdanju, Unreal Tournament 2004 vizuelno nadmašuje
      prethodnu verziju, a stoga je i nešto zahtevniji. Za testiranje smo koristili
      ugrađeni Bridge of Fate demo.

      U nižim rezolucijama su novi akceleratori ponovo ograničeni CPU-om, jer je GPU
      load nizak (teksture su osrednjih dimenzija, geometrija je slabija). Međutim,
      po igraonicama se upravo igra sa ovakvim setovanjima, pa smo zadržali demo verziju.

      Halo PC

      Igra zbog koje su mnogi pre dve godine kupili X-Box konzolu, fenomenalni Halo
      u verziji za PC je optimizovan za Direct X 9 kartice. Program koristi Pixel Shadere
      verzije 2.0. Ovi programi se mogu izvršavati i preko starijih verzija Pixel Shadera,
      ali smo mi koristili DX9 mod, najveći broj detalja i trilinearni mod filtriranja.

      Još jedna igra koja pokazuje ogromnu fillrate i memory bandwidth moć GeForce 6800
      Ultra kartice.

      Far Cry

      Igra koja je po mnogima redefinisala žanr, odnosno pooštrila kriterijume kada
      je vizuelni aspekt u pitanju. Ova engine je demonstracija mogućnosti Direct X
      9 API-ja u praksi – tu je ogroman broj poligona i efekata koji se izvršavaju u
      Shader jedinicama, celih 128 MB video memorije je po nivou rezervisano i zajedno
      sve izgleda jednostavno fenomenalno. Fotorealistična grafika i do sada najbolja
      fizika i dizajn nivoa su atributi ove fenomenalne igre. Tu su efekti Normal mapiranja,
      polybump mappinga, napredne enviroinment fizike, promenljiva geometrija terena,
      dinamičke senke i osvetljenja, motion capture animacije… Testirali smo sa Very
      high i Ultra high podešavanjima (gde je moguće), uz pomoć već snimljenog i opšte
      prihvaćenog demoa, koji koriste i strane kolege (X-BitLabs, DigitLife, HardOCP).

      Nažalost, još uvek nije izašao patch koji bi popravio stanje stvari i pomirio
      FarCry sa GeForce 6800 Ultra i 61.xx drajverima… Kvalitet slike je zaista mnogo
      lošiji čak i od onog koji nude iste kartice sa 5x.xx drajverima. Očigledno je
      da se čeka Direct X 9.0c i Patch 1.2 (mada i 1.1 podržava SM 3.0), pa ćemo videti
      koliko će to usporiti nVidia karticu.

      Painkiller

      Ovaj sveži naslov pokreće moderan Direct X 9 engine i koristi dosta postprocessing
      i stancil efekata. Najupečatljivije su senke i rag-doll fizika, zatim full scene
      efekti koji se primenjuju u realnom vremenu (poseban mod koji transformiše percepciju
      nivoa). Ponovo smo testirali na najvišem nivou detalja, a u tome nam je pomogao
      demo skinut sa popularnog stranog foruma i fraps utility.

      Zahtevni modovi ~ Antialiasing

      Anisotropic

      Antialiasing + Anisotropic

      Overclocking

      Iako je D.O.T zaista odličan način da overklokujete vašu karticu, a
      da ne strepite, mi smo, ipak, ručno, doveli karticu do odličnih 455 / 1170 MHz,
      uz očuvanje maksimalne stabilnosti. Kartica uz dodatno hlađenje, može da se
      ubrza do fantastičnih 465 / 1200, što je bezmalo nivo 6800 Ultra Extreme modela.
      Sa druge strane, budite spremni na više buke, pošto je dodatna osmica, naslonjena
      na samu grafičku karticu, bučnija nego kuler na samom akceleratoru.


      Zaključak



      nVidia je konačno pokazala svima. nV40 je moćan, brz, kompleksan i veoma moderan
      GPU koji će sigurno naterati konkurenciju da ozbiljno poradi na R5xx familiji
      akceleratora. Nisu u pitanju samo mogućnosti video enkodinga, nove sitnice koje
      ćete koristiti u dual view režimu rada ili odličan kvalitet slike. To možemo
      očekivati i od jeftinijih izdanja CineFX 3.0 familije akceleratora. Radi se
      o izuzetnim performansama, koje će doći do izražaja u kompleksnim igrama kao
      što je, u prvom redu Doom III, a onda i Half Life 2, STALKER i druge. Pozitivne
      promene su uočene i kod pisanja drajvera. nVidia sada ima dvostruke razloge
      da bude poštena i maksimalno povrati poverenje u svoje upravljačke programe,
      koji su po funkcionalnosti prevazišli kategoriju kojom se imenuju. Najveća prednost
      – podrška za Shader Model 3.0 i Flow Control je nešto što sada sigurno peče
      ljude u ATI-ju. Možda još ne finansijski, možda ni renome još nije počeo da
      biva narušen, ali je jasno da je nVidia ponovo, ako ne uvek brzinski, onda makar
      tehnološki šampion kome ovoga puta treba skinuti kapu. Istina je da je kartica
      glomazna, da je sistem za hlađenje udaljava od SFF računara, istina je da ćete
      možda morati da pazarite i moćno napajanje, ali verujemo da će se sve to isplatiti.
      Takođe, mislimo da će GeForce 6800 GT biti najpopularniji model – ubrzo će većina
      ovih kartica moći da se overklokuje ne samo do 400, već verovatno i do 450 MHz
      za core i oko 1100 MHz za memoriju, što je više nego dovoljno, pogotovo za sumu
      koja je do 100 evra niža od one koju je potrebno izdvojiti za Ultra model. Nadamo
      se da će sledeća revizija drajvera i Direct X 9.0c pokazati da nV40 može da
      bude i impresivniji, ali se pomalo plašimo da će procesor biti sporiji u SM3.0
      režimu, bar u samom startu.
      nV40 je odličan za krajnjeg korisnika. Ovo nemojte shvatiti kao trenutnu preporuku
      za video karticu od 440 evra. Uspeh nV4x familije je važan za nVidiu i industriju
      uopšte. Prijateljima iz kompanije Microstar još jednom zahvaljujemo i čestitamo
      na još jednom uspešno realizovanom proizvodu.
      Korisna adresa: Microstar
      SCG

      Ostani u toku

      Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

      Hvala!

      Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

      Možda vam se svidi
      X870E Aorus Pro i X870 Aorus Elite Wi-Fi7 test