Branko Maksimović
NVIDIA GeForce GTX 550 Ti – ASUS (1/2)
Izuzetno je lepo ako sebi možete da priuštite Dual GPU grafičke kartice najviše klase i igrate se na više monitora odjednom; PC gaming je makar zadržao neke od prednosti koje su nezamislive na drugim platformama, a mogućnost za dalje unapređenje igračkog užitka (u nedostatku boljeg prevoda reči immersion) je upravo jedan od tih ekskluziva. Tako i igranje Crysis 2 ili F1 2010 igre na tri monitora u 5760 x 1080 piksela ili na, zašto da ne – tri 3D projektora (vidite li na šta mislimo kada kažemo da PC u ovim stvarima ima nedvosmislenu prednost?) jednostavno mora biti vanserijsko iskustvo koje nijedan Xbox 360 ili PlayStation 3 na ma koliko velikoj “plazmi”, ne može da nadmaši. Iako se broj piksela u 6-way EyeFinity kombinaciji (5760 x 2160 piksela) gotovo izjednačava sa brojem dinara koje je potrebno utrošiti na ovakav jedan setup, niko vam ne može reći da nemate pravo na to. Ako to možete da priuštite. Većina smrtnika ipak nema toliko novca ili ih, ako i ima, ne izdvaja u tolikoj meri na ubogi PC računar. Skijanje na Andima ili sunčanje u Phuketu zvuče mnogo primamljivije, pa je uvek aktuelna opcija “najbolje za toliko-i-toliko novca”, a naši tekstovi na ovu temu (1 i 2) su upravo i najčitaniji članci u rubrici u kojoj se nalaze testovi grafičkih kartica.
Već smo pisali o modelu GeForce akceleratora za 2011. godinu koji je čuvena NVIDIA, zajedno sa partnerima, ponudila u $200 segmentu. GeForce GTX 550 Ti segment, Golf-klasa u svetu grafičkih kartica, najpopularniji je kada je (r)etail u pitanju, a najpopularniji je i među igračima. Nećemo pokušati da poreknemo da se više primeraka grafičkih kartica proda u nižim segmentima, ali je upravo Sweet Spot ono što donosi najveću zaradu i ono što određuje odnose snaga u “vrzinom kolu” koje igraju dva najveća (i jedina) GPU dizajnera o čijim proizvodima stalno i pišemo. To ipak ne znači da su kartice iz segmenta od $150 dolara nezanimljive – u duhu aktuelnog sajma automobila, mogli bismo reći da su nekim kupcima dovoljni i Fiesta i Polo, ali, koliko oni zaostaju i koliko manje nude od Focusa i Golfa?
Odnos snaga
NVIDIA nije morala da brine o tome da će ostati na prvoj poziciji kada je AMD najavio svoju Radeon HD6800 seriju kartica. I ranije je bilo poznato da će one ponuditi iste performanse kao i serija HD5800, za manje novca. Na kraju su Radeon HD6800 kartice bile i sporije od svojih prethodnika (ali i zaista koštaju dosta manje), a ono što je NVIDIA-u nateralo da ubrza rad na poboljšanoj verziji Fermija je Radeon HD6900 serija kartica, za koju se takođe ispostavilo da ne cilja na najjači Fermi 2 model – GeForce GTX 580, već na slabiji model sa istim čipom. NVIDIA je sa drugom generacijom Fermi kartica uradila i više nego što su mnogi očekivali, ali su se svi, na kraju, složili da je GeForce GTX 580 ono što je GTX 480 trebalo da bude. GeForce GTX 580 je kao što je i očekivano – brži od svog prethodnika. NVIDIA-i nije bilo ni neophodno da ponudi nešto drastično brže, već da to upakuje u proizvod sa boljim odnosom potrošnje i performansi, da sam GPU ima bolji yield u proizvodnji, kao i da temperatura i ukupna potrošnja budu u nekim granicama normale. U prevodu – Fermi 2 nije smeo da ima TDP veći od prethodnika, a svakako mora da ima više radne učestanosti i veći broj shader jezgara, kako bi postigao veće performanse. U IT industriji se to često “lako” rešava, jer Murovo pravilo čini svoje. U sitnijem proizvodnom postupku možete napraviti mišićaviji čip i zadržati se u sličnim okvirima kada su potrošnja i toplotna disipacija u pitanju.
Jedna od prednosti NVIDIA Fermi arhitekture je i ranije bio moćan tessellation engine. Kod GF110, on je dodatno poboljšan, što je jako bitno, jer se radi o funkciji koju koristi i koju će koristiti sve veći broj game developera tj. dizajnera igara. Tessellation engine čini 16 PolyMorph Engines – 16 jedinica koje su posvećene samo de-kompoziciji geometrijskih primitiva. I dok AMD, s jedne strane, apeluje da upotreba previše malih trouglova, kakvi se koriste u HAWX 2, Heaven 2.0 (DX11, Tessellation High) u današnjoj real-time 3D grafici nema mnogo smisla, NVIDIA pokazuje da se i ovako kompleksne kalkulacije mogu izvršiti dovoljno brzo ako GPU ima posvećenu jedinicu za obradu geometrije. Aktuelna Cypress / Barts arhitektura podrazumeva procesiranje jednog trougla po klok ciklusu unutar ALU jedinice, dok se kod GPU-a kakav je Fermi, obavlja više od jedne ovakve operacije po “kloku”. Kako bi pokazala moć svoje tessellation jedinice, NVIDIA je kreirala demo “Endless City” koji po sceni ima i preko 600 miliona trouglova i 500 hiljada dinamičkih svetlosnih izvora! Demo proceduralno generiše nove zgrade, tako da grad uvek izgleda drugačije, a sama adaptivna teselacija podrazumeva povećanje broja detalja (poligona) na objektima koji su bliže kameri, odnosno smanjenje detalja za one koji su udaljeni. Objekti od kojih su sačinjene zgrade su prilično jednostavni, ali se na njima nalaze 3D displacement mape, koje čine da scena izgleda prilično impresivno.
Još jedan rebalancing – GF116
GeForce GTX 550 Ti pokreće novi GF116 procesor, koji je naslednik GF106-ice (GeForce GTS 450) na sličan način na koji je GF110 bio naslednik GF100-tke, a GF114 naslednik “stočetvorke”. Kažemo – na “sličan način” baš zato što je GF116 i fizički malo drugačiji od prethodnika, dok su dva veća “para” međusobno sličniji, s tim da su nove verzije kompletno otključane. Odnos shader / TMU / ROP / Mem Ctrl. jedinica je kod GF116 u odnosu na GF106 ipak nešto drugačiji, pa je čip u neku ruku i nov dizajn, iako se u potpunosti oslanja na postojeću i poznatu Fermi 2 arhitekturu.
Baš kao što je GeForce GTX 560 Ti koristio praktično isti GPU kao i GTX 460, ali kreiran u poboljšanom TSMC 40-nm procesu, tako je i kod GF116 u odnosu na GF106 otključan dodatan deo jedinica. Ali, dok su GF100 i GF104 u odnosu na GF110 i GF114 imali zaključane ALU / CUDA jedinice (odnosno klaster ili dva istih), kod GF106 je (u odnosu na GF116) bio zaključan back-end deo koji obuhvata trećinu ROP particije i deo memorijskog kontrolera (širine 64 bita). Tako je GF106 imao 16 piksela po kloku na ROP delu i 128-bitnu memorijsku magistralu, ali je fizički bilo prisutno 24 x PPC ROP jedinica i tri crossbar kontrolera širine 64 bita (ukupno 192 bita). GF116 upravo ima 24 render-back end “jedinice” i 192-bitnu memorijsku magistralu. Broj CUDA jedinica je 192: jedan (GPC) graphics processing cluster sa četiri streaming multiprocessors jedinice i u svakoj 48 CUDA (ALU ) jezgra. Svako multi-jezgro ima 64K posvećene keš memorije koja može biti konfigurisana kao 48K deljene + 16K L1 keš memorije ili obrnuto. Količina L2 keš memorije kod GF100 GPU-a je 768K, dok je kod GF104 i GF106 čipa smanjena na 512K. Na L2 memoriju se oslanjaju load/store jedinice, a ova keš memorija se nalazi između GPC jezgara i memorijskih kontrolera koji su organizovani u crossbar i zapravo predstavljaju četiri jedinice širine od 64 bita, što GPU-u daje ukupno 256-bita širok put ka video memoriji. GF106 ima 16 raster operators (ROP) ili render-back end jedinice.
Oni koji su čitali naš test GeForce GTS 450 kartice se sećaju da je i GF106 imao identičan grafikon koji možete videti iznad, a greške nema – jer nam je NVIDIA dostavila dva ista “crteža”. GeForce GTS 550 Ti ima veći broj ROP jedinica za 33%, baš kao i za 33% širu memorijsku magistralu. Kod GF100 i GF104 čipa, CUDA jedinice su isključivane radi poboljšanja yield-a na tada ne-tako-razvijenom TSMC 40-nm procesu. Iz istih razloga je i kod GF106 isključen deo GPU-a, ali je tada odluka pala na to da se isključi trećina ROP particije i pripadajući deo memorijskog kontrolera.
Iako imaju isti broj CUDA jedinica, GeForce GTX 550 Ti ima veći shading / computing power od prethodnika. Dok je GeForce GTS 450 imao radni takt od 783 MHz za GPU i 1566 MHz za CUDA procesore (uz VRAM na 3600 MHz), novi GTX 550 Ti radi na 900 / 1800 MHz, a memorija na čak 4104 MHz (efektivan klok). Ono što najviše iznenađuje je što su retail modeli u 90% slučajeva i znatno brži, pa ASUS i MSI nisu jedini koji nude DirectCU TOP i Cyclone OC modele čiji GPU radi na 1000 MHz+, a shader jedinice na čak 2 GHz! U odnosu na 1500-ak MHz kod GeForce GTS 450 modela, ovo je značajno ubrzanje.
Osim bržeg radnog takta CUDA jedinica i samog GPU-a, tu je i šira memorijska magistrala (192-bit), veći broj ROP klastera, ali i veći VRAM. Složićete se da je sada 1 GB neki standard za karticu koja bi trebalo da pokreće najnovije DirectX 11 naslove, pa tako i GeForce GTX 550 Ti ima 1GB VRAM memorije. Ako se pitate kako je NVIDIA izvela to da kartica sa neparnim brojem memorijskih kontrolera (3 x 64-bita) ima “okruglu, parnu količinu” memorije, odgovor je relativno jednostavan. Naime, GeForce GTX 550 koristi i čipove kapaciteta od 128, ali i one koji imaju 256MB – dakle, čipove od 1 Mbit i od 2Mbit-a. NVIDIA je zbog ove “zavrzlame” morala da samu karticu obogati posebnim “memory configuration logic” čipom (kako ga sama kompanija naziva), a čak su i drajveri morali da budu “dorađeni” kako bi ova promena radila nesmetano. Ipak, verujemo da je ova “logika” ipak rešenje koje nije toliko skupo, jer je NVIDIA relativno lako mogla da kartice opremi sa 1.5 GB memorije i zadrži marketinšku prednost u odnosu na konkurenciju. Kako sami kažu, GeForce GTX 550 Ti je kartica koja pripada “cost sensitive” segmentu, pa bi verzije sa 1.5 GB VRAM-a ipak i u proizvodnji koštale više nego što bi valjalo za proizvod
Unapređenja kod GF116?
GF116 čip, kao i GF106, ima 192 CUDA jedinice i 16 texture management units (TMUs). Dodatna ROP particija i 64-bitni memorijski kontroler, uključili su u upotrebu i još deljene L2 keš memorije (128K), koja sada ukupno broji 384K. Svaki od dva 64-bitna dela crossbar memorijska kontrolera kod GF106 su vezana za dva 1Mbit (128MB) DRAM čipa, pa je tako kartica imala 512 MB memorije (bilo je verzija i sa 1 GB memorije, naravno). GeForce GTX 560 Ti ima 256-bitni memorijski bus, pa je tako upotreba (bržih) čipova istog kapaciteta dovela do ukupne količine VRAM-a od 1 GB. Kod pretohdnih modela akceleratora koji su imali 192-bitnu magistralu, i količina memorije je bila “nestandardna”, pa je tako GeForce GTX 460 stizao u verziji sa 1 GB memorije i magistralom od 256 bita, dok je slabiji model sa 768 MB memorije imao magistralu širine od 192 bita. GeForce 8800 / 9800 GS su imali 192-bitnu magistralu i imali su 384 MB memorije. NVIDIA je, dakle, po prvi put morala nešto da učini ako je želela da kartica sa 192-bitnom magistralom ima 1GB memorije. I to je prvi put učinjeno kod GF116, kod kog su dva od tri memorijska kontrolera vezana za 2 x 256 MB memorije (2 x 2 čipa po 128 MB (1Mbit)), dok je treći kontroler vezan za 1 x 512 MB (1 x 2 čipa po 256 MB (2Mbit)). Pomenuti “memory configuration logic” kontroler, za koji ne znamo da li se nalazi na PCB-u ili je unutar GPU-a, vrši “load balancing” kako bi čuvanje shader, geometry, texture i drugih podataka teklo bez greške, a sam kontroler nadgleda softver unutar ForceWare drajvera. GeForce GTX 550 Ti zadržava sličnu potrošnju (TDP) u odnosu na prethodnika. GeForce GTS 450 je imao TDP od 107W, dok je GTX 550 Ti na “cifri” od 116W, što nije mnogo više i što će biti “pokriveno” jednim dodatnim PCI Express konektorom od 6 pina.
GeForce GTX 550 Ti je, naravno, naslednik GeForce GTS 450 akceleratora, ali verujemo da se mnogi pitaju da li će moći da nadmaši GeForce GTX 460 768MB, jer je njegova cena niža od cene pomenutih modela. Mi smatramo da to neće biti slučaj, osim u možda nekim situacijama, gde će radne frekvencije biti ključni faktor. Cena novih GeForce GTX 550 Ti kartica bi trebalo da se kreće oko 150 dolara, odnosno oko 120-130 evra na našem tržištu, što znači da je konkurent starim Radeon HD5770 modelima koji su i predugo na tržištu i koje će, verujemo, nadmašiti po performansama. NVIDIA dugo nije imala model koji bi mogao da konkuriše ovom Radeonu, zbog čega je AMD i odlučio da HD5770 ostavi tamo gde jeste kada je kreirao Barts (Radeon HD6800 seriju), koja je, po mnogima, trebalo da nosi oznaku HD6700 (jer su ovi modeli slabiji od prethodnika iz HD5800 serije), dok su Cayman (Radeon HD6900) modeli trebali da nose HD6850 i HD6870 oznake, time ostavljajući dovoljno “prostora” u nomenklaturi za dva Antilles (Radeon HD6990) modela. No, vratimo se na GeForce i vidimo kako izgleda prva testirana GF116 kartica, ASUS ENGTX 550 Ti DirectCU II…
Uskoro i drugi deo teksta:
Kartica na testu – ASUS ENGTX 550 Ti DirectCU, Rezultati, Overclocking i Rezime