Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


NVidia GeForce 4: Až příliš překotná evoluce

  5:20aktualizováno  5:20
Včera (6.2.2002) byl představen zbrusu nový a dlouho očekávaný grafický čip společnosti nVidia. Nese název GeForce 4 a my vám již nyní přinášíme exkluzivní informace o jeho nových vlastnostech a vymoženostech. Pokud vás tedy zajímají všechny techniké detaily této horké novinky ( a nejenom ty), pak neváhejte a čtěte.
Úvod

Ještě se ani pořádně neuklidnil rozruch kolem Titanium série od nVidie a už je tady jaro a s ním nový produkt. Očekávaný poměrně napjatě, neboť nVidia má ve zvyku na podzim přinášet obměny svých produktů a na jaro přicházet s opravdu novou generací. I když, tentokrát to není takový přelom jako před rokem, a nebyl jsem si zcela jist jak tento článek pojmout. Nakonec jsme zavrhli titulek "GeForce4 – propadák“ :) a článek bude sestávat ze 2 částí - úvodní popis nových karet, a v závěru můj komentář o mém soukromém zklamání.

Logo nVIDIA

NVidia se tentokrát rozhodla ohlášení nové generace pojmout ve velkém, a nepředstavila jen jeden produkt, ale celou rodinu (čímž zajisté vnese ještě větší zmatek do ceníků a hlav zákazníků).

Jedna se o tyto 3 skupiny karet:

  • Geforce4 Ti 4600 a 4400 - aneb ta opravdová "Geforce4", prakticky se vším co nVidia přináší, s odpovídajícím výkonem, no a bohužel také odpovídající cenou.
  • Geforce4 MX 460, 440 a 420 - to, od čeho mnozí očekávali "GF3 pro chudé". Bohužel to není tak docela pravda, ale více později.
  • Geforce4 440 Go, 420 Go a 410 Go - grafické karty pro notebooky.

    Logo verze Ti Logo verze MXLogo verze Go

Shrňme si základní vlastnosti karet do tabulky:

  GeForceTi 4600 GeForceTi 4400 GeForceTi 4200 GeforceMX 460 GeForceMX440 GeForceMX420 GeForce Go
Fillrate (AA vzorků/sec) 4.8 miliard 4.4 miliardy 3.6 miliard 1.2 miliardy 1.1 miliardy 1 miliarda max. 0.5GP
Trojúhelníků/sec 136 milionu 125 milionu 102 miliony 38 milionu 34 milionu 31milionu max. 30mil
Přenosová rychlost paměti (GB/sec) 10.4 8.8  8.0 8.8 6.4 2.656 max. 8
Max.velikost paměti 128 MB 128 MB 128 MB 64 MB 64 MB 64 MB 64 MB
Takt jádra 300 MHz 275 MHz 225 MHz 300 MHz 270 MHz 250 MHz 250 MHz ??
Takt paměti 650 MHz 550 MHz 500 MHz 550 MHz 400 MHz 166 MHz 500 MHz ??
nFiniteFX II  ano ano ano  ne  ne  ne  ne
LMA II ano ano ano ano ano ano ano
Accuview AA  ano ano ano ano ano ano ano
nView  ano ano ano ano ano ano ano
VPE  ne ne ne ano ano ano ano
PowerMizer ne ne ne ne ne ne ano

Poznámka k tabulce - čísla vycházejí z materiálu nVidie a tabulek na serveru Tomshardware.com

A jaké funkce nový čip obsahuje? Tady je odpověď

nFiniteFX II

Když minulý rok nVidia přišla s revoluční programovatelností obou hlavních jednotek jejich karet (s vertex shadery určenými pro hardwarové zpracování geometrie, a pixel shadery určenými pro výpočet jednotlivých pixelů) dala oběma technologiím souhrnný název nFiniteFX (obě technologie byly licencovány Microsoftem a objevily se tak jako zakladní kámen rozhraní Directx 8).

Je příznačné, ze ačkoliv je celá oblast počítačové grafiky přímo přeplněna nejrůznějšími pojmy a názvy, marketingová oddělení výrobců karet neustále přidávají další a další – a to i přesto, že nově pojmenovávají dávno známe algoritmy.

Nová generace karet GeForce přináší nFiniteFX II. Čím se liší vůči Geforce3? Tak především byla přidána druhá jednotka pro zpracování vertex shaderu. Tyto jednotky by měly bez problémů běžet neustále paralelně, protože typicky není problém zpracovávat 2 vertexy (body v 3d prostoru, typicky vrcholy trojúhelníku) současně - vertex shadery jsou navrženy tak, ze při výpočtech neexistuje žádná závislost mezi dvěma zpracovávanými vrcholy.

Vezmeme-li v úvahu, že původní GeForce3 byla taktována na 200 MHz, zatímco aktuální vlajková loď nVidie má takt 300 MHz a 2 výpočetní jednotky, jednoduše nám vychází, že geometrický výkon nové GeForce4 je 3x větší.

Toto by mělo umožnit náročnější efekty, a usnadnit rozhodování, zdali provádět výpočty procesorem nebo grafickou kartou.

Maximální délka vertex shaderu je 128 instrukcí. Při takto dlouhém programu dokáže GeForce3 počítat přibližně 1.5 milionu vertexů za sekundu, zatímco GF4 spočítá celých 4.7 milionu. Při použití kratších programů dostáváme čísla vskutku závratná. Otázkou je, jak budou sražená dolů omezenou rychlostí AGP sběrnice a videopaměti.

Grafická karta GF4 Ti4600Částečné změny doznaly také pixel shadery. Došlo k jejich optimalizaci pro použití 3 nebo 4 textur Současně. Stejně tak jako geforce3 tak i geforce4 má jen 2 texturovací jednotky pro každou pipeline a tudíž při použití 3 nebo 4 textur dochází ke zpracování na dvakrát.

Tento proces by měl být nyní urychlen, avšak nVidia zatím nezveřejnila žádné informace pro programátory, takže je těžké říct, jak přesně se tato změna projeví.

GeForce4 také zpřístupňuje pixel shadery 1.2 a 1.3, které definuje DirectX8.1. Pixel shadery 1.2 přinášejí několik nových instrukcí, jejich význam se však nedá vysvětlit několika větami a tak asi nejvýraznější z nich je texreg2rgb, která umožní s pomoci 3d textur provést libovolné přemapování barev textury.

Asi ten nejjednodušší příklad by byl filtr pro výpočet negativu. Pixel shadery 1.3 přinášejí jedinou novou instrukci, která umožňuje nahradit hloubku (tzv. Z-Value) právě zobrazovaného bodu.

NVidia to označuje jako Z-Correct Bumpmapping - což je podle mě pojem poněkud zavádějící. Pro nejjednodušší příklad je dobré představit si tradiční 2d obrázek, který umístíme na obrazovku – tak zvaný „sprite“. Dále si představte jakoukoliv 2d počítačovou hru, nejlépe střílečku, nebo hru s isometrickým 3d pohledem, například nějakou realtimeovou strategii. Tradičně se takový sprite zobrazuje s konstantní hloubkou, proste se opravdu chová jako placka.

Pixel shader 1.3 umožňuje určit hloubku pro každý jednotlivý bod spritu zvlášť, a tím jim dodat zdání trojrozměrnosti při interakci s pozadím nebo ostatními sprity. Pokud chcete názorný a jednoduchý příklad, zkuste si zahrát hru Original War a všimněte si, jak se postavičky zanořují při chůzi v trávě.

Z výše uvedeného popisu ale vyplývá, že ATI se svým Radeonem zůstává v oblasti pixel shaderu stále na špici.

Možná jste si také všimli podivného písmene "N" u série GeForce4 MX. Ano, bohužel MX série neobsahuje nové vertex a pixel shadery, ale neobsahuje dokonce ani ty původní z GeForce3 ! Jinými slovy, Geforce4 MX je karta implementující rozhraní DX7, nikoliv DX8.

V tomto ohledu je použití označení "Geforce4" velice matoucí, neboť se jedná vlastně o pokračování GeForce2, nikoliv GeForce3. NVidia tak tímto tahem připomíná ATI, která prodává pod označením Radeon 7500 vylepšenou verzi původního Radeonu, a pod označením 7200 dokonce Radeon VE, což je karta podobna spíše Rage128.

LMA II

Pod souhrnným názvem Lightspeed Memory Architecture II se skrývá souhrn technologií, sloužících pro boj s omezenou rychlosti paměti. V porovnání s pokroky na poli procesorů i grafických karet prostě paměti beznadějně zaostávají.

Chladič GeForce4Zkráceně se jedná o „crossbar-based memory controller“ – tedy 4 násobný (v případě série MX 2 násobný) řadič paměti, který umožňuje místo jednoho 256 bitového bloku paměti načíst dva 128 bitové, případně čtyři 64 bitové. Využívá se zde toho, že grafický čip zdaleka ne vždy potřebuje načíst celý velký 32 bajtový úsek paměti, spise více bloků, ale z různých míst v paměti.

Quad Cache Memory

Souhrnné označení pro 4 cache paměti obsažené na čipu. Jedná se o cache pro již zpracované vrcholy (nemusí se počítat vícekrát), cache pro již zpracovaná geometrická primitiva (triangle setup), cache pro data textur a zápisová cache pro vykreslené body.

Bezeztrátová komprese Z-Bufferu

V ideálním případě snižující přenos dat Z-Bufferu mezi pamětí a čipem až 4 násobně.

Testování viditelnosti

Minimalizuje počet výpočtů, které se provedou pro pixel, jež není na obrazovce vidět. Toto se uplatni jen v případě, že hra kreslí objekty alespoň přibližně zepředu dozadu.

Rychlé vymazávání Z-Bufferu

Na začátku každého snímku je třeba vymazat obsah Z-Bufferu a tato technologie proces urychluje.

Auto pre-charge

Grafický čip informuje paměti o místě, kde bude číst a to již před aktuálním požadavkem. Díky tomu se zkrátí doba čekání na její odezvu.

Obecně se jedná o stejné nebo vylepšené technologie, které používala již GeForce3, a taktéž konkurenční Radeon. Je ovsem nutno přiznat, že kromě zvýšené frekvence jádra a pamětí se zřejmě zejména toto podílí na celkově vysokém výkonu GeForce4.

AccuView AA

3dfx při uvedení svého čipu VSA 100 přineslo FullScreen Antialiasing do všeobecného povědomí. Firma následně zkrachovala, ale antialiasing už s námi zůstal. Zatímco v původní verzi na kartách GeForce1 a GeForce2 nVidia používala supersampling, tedy antialiasing, který by se dal téměř označit za softwareové řešení (i když samozřejmě s výpomocí hardware), u karty geforce3 přešla na multisampling, který vyžaduje přímou podporu v čipu. U GeForce4 zůstal princip stejný, ale posunulo se umístění vzorků, které by tak měly přesněji reprezentovat renderovaný obrázek.

Kromě toho byl zoptimalizován způsob předávání dat v rámci čipu, výsledkem čehož je zhruba 1.5 násobný výkon při 2x antialiasingu v porovnání ni s GF3. Podle testu na již zmíněném Tomshardware má v některých případech GeForce4 s 2x antialisingem stejný výkon, jako Ati Radeon 8500 bez něj, což je opravdu působivé. Zůstaly samozřejmě i možnosti použít Quincunx a 4x antialiasing, stejně jako 4x antialiasng v kombinaci s anizotropním filtrováním.

nView

Od doby, kdy firma Matrox přišla s tzv. "dualhead" kartou, tedy možností připojit současně 2 monitory, stala se tato technologie (pod nejrůznějšími názvy, nVidia používá TwinView) poměrně populární. Ve čtvrté generaci se TwinView objevuje nejen u MX karet, ale i u plnohodnotných Ti. Geforce4 by měly umožňovat připojení analogového monitoru, digitálního flat-panel monitoru (LCD) a nebo TV, a to v jakékoliv kombinaci (kromě 2 TV současně).

Velké změny zároveň doznal software, který by měl zvládnout spolehlivěji používané kombinace - 1 velký desktop, clone, zoom atd. Pod označením nView se skrývá také možnost definovat až 16 různých desktopů a rychle mezi nimi přepínat, stejně jako nastavení průhlednosti u individuálních oken.

Protože se v tomto případě jedná spíše o softwareovou záležitost, teoreticky je tady šance, že nové detonátory jí zpřístupní i na starších kartách (i když je to otázka).

Z původních MX2 karet se do nové generace přenáší také Digital Vibrance Control - možnost lepší regulace kontrastu barev.

VPE

Video processing engine, tedy podpora dekódování mpeg videa, tentokrát včetně motion compensation a inverzní cosínové transformace (IDCT), což poskytuji karty firmy ATI už několik století. Uvidíme, jestli se toto vylepšení nějak pozitivně projeví na kvalitě přehrávání videa. Bohužel, tato část je implementována pouze u MX a Go variant, a plnohodnotná Geforce4 Ti je o ni tedy stale ještě ochuzena.

PowerMizer

Je souhrne označení technologií šetření energií u mobilních Go variant karet.

Komprese textur

Když detonátory konečně zpřístupnily podporu komprimovaných textur (známých pod původním označením S3TC nebo Microsoftím označení DXTC1-5), zvedla se na internetu velká vlna diskusí ohledně její chabé kvality (zejména u některých textur ve hře Quake 3 Arena – typicky obloha).

I když nVidia původně jakékoliv problémy popírala, ukázalo se, že čipy GeForce skutečně obsahují chybu (nebo je to feature?) u dekomprese formátu DXT1, což je komprimovaná textura bez alfa kanálu (pro detailisty: je 1 bitový, ale často není využíván). Čipy GeForce totiž takovou texturu dekódují pouze 16 bitově, což vede k ošklivým efektům, zejména u textur s plynulými barevnými přechody.

Chyba bohužel zůstala i u karet GeForce 2 a GeForce 3. Byla opravena teprve v NV2A, což je čip obsažený v herní konzoli X-Box.

(Update: Stejná chyba zůstala i na GeForce 4 MX 440!)

Nyní se tedy korektní implementace konečně dočkáme i na PC (samozřejmě jen u nVidia karet, například Radeony tento problém nemají).

A to je vše.. skoro vše..

Tímto jsme víceméně vyčerpali soupis vlastností nových karet, nebo minimálně těch, které nVidia považuje za nutné zdůraznit.

A shrnuti? Nejedná se tentokrát o žádnou revoluci, ale jen a pouze o evoluci. Až na několik (sporných) detailů vlastně nové karty nepřináší z programátorského hlediska žádné nové vlastnosti, pouze urychluje ty původní.

Samozřejmě, je i neprogramátorské hledisko a například TwinView pro "neořezanou" sérii karet je jednoznačně plusem. Pomineme li tento, je největším plusem samozřejmě vlastní výkon, díky kterému nové karty skutečně září (a také dělají některé DX 8 technologie konečně plně využitelnými). Jakmile dostaneme kartu k dispozici, uveřejníme na našich stránkách vlastní testy.

Pokud navíc nezůstane cena v nedostupných výšinách, povedl se zřejmě nVidii královský tah. Pokud snad ceny vysoké zůstanou, minimálně srazí dolů stávající GeForce3 (které mají prakticky stejné možnosti).

Komentář: Dle mého názoru je ovšem velkým zklamáním série MX. Navzdory očekávání nepřináší na trh levných videokaret možnosti Direct X 8. Jejich výkon je sice slušný, ale je otázka, jestli nebude lepší koupit Geforce2 Titanium nebo dokonce Geforce3Ti, které by měly mít srovnatelný nebo lepší výkon, jen o něco vyšší cenu, a v tom druhém případě výrazně větší možnosti.

Za povšimnutí také stojí jeden zajímavý úkaz. V podstatě od vydání TNT2 (a definitivně od GeForce1) si nVidia drží víceméně oprávněně pověst technologického inovátora, a i když byla občas krátkodobě překonána, vždy náskok velmi rychle dohnala. Ovšem na podzim ATI zveřejnila svůj Radeon 8500, který obsadil technologicky i výkonnostně (i když zde je to sporné) trůn. Očekávalo se, ze GeForce 4 opět zamíchá karty, ovšem stalo se tak pouze na poli výkonu.

Co se týká možnosti hardware, zůstává Radeon stále králem. A uvážíme-li, ze nVdia má ve zvyku vydávat novou kartu každých 6 měsíců, hned tak něco zřejmě Radeonu onu pověstnou korunu nevezme. Vždyť před necelým rokem by člověk řekl, že se nVidia stala definitivním vládcem a postupně konverguje k úplnému monopolu, ovšem situace se rychle změnila. Přidáme-li očekávaný návrat Matroxe na hráčské pole někdy v létě, situace začíná být opět velmi zajímavá.

A samozřejmě, je tady stále firma Bitboys, která odmítá zveřejnit nějaký HW stejně sveřepě, jako odmítá zkrachovat, a vždycky je malá šance, že konečně udělají slíbený převrat. A v konečném důsledku zvítězíme vždy my - zákazníci...

Poslední komentář: Tak a teď přichází na začátku slíbený odstaveček, zabývající se poněkud subjektivním pohledem na celou záležitost.

Někdy na jaře minulého roku obcházeli zástupci nVidie vybrané výrobce počítačových her, a po podepsání NDA je seznamovali s detaily svého hardware. A mimo jiné došlo i na schopnosti karty, která by se měla na trhu objevit na jaře roku 2002. Od té doby některé informace prosákly na veřejnost (například backbuffer s podporou více než 24bitových barev), některé ne, ale každopádně se mělo jednat o velice zajímavý hardware. Bohužel, ohlášená GeForce4 NENÍ touto kartou. Je otázkou, co se stalo a nabízí se hned několik vysvětlení:

  • došlo k nechtěnému zpoždění ve vývoji
  • došlo k záměrnému zpoždění, protože nVidia usoudila, ze DX 9 nebude vča pripraven (zda se, že je opožděn v porovnání s loňským DX 8) a nechtěla zveřejňovat kartu jejíž možnosti nelze nijak využít.
  • došlo k záměrnému zpoždění, protože nVidia se cítí bezpečně ve své pozici, a zpomalení vývoje umožní snížit náklady na r'n'd, které musí být v jejím případě poměrně závratné.
  • kombinace výše uvedeného..

No a samozřejmě je možné, že jsem očekával příliš. Vezmeme si historii karet nVidie od doby, kdy ohlásila svůj záměr dodržovat 6 měsíční vývojový cyklus:

  • jaro 1999, vychází TNT2
  • podzim 1999, vychází GeForce1 SDR
  • zima 1999, vychází GeForce1 DDR
  • jaro 2000, vychází GeForce2, slušně vylepšená verze GeForce1
  • podzim 2000, vychází GeForce2 Ultra, tedy přetaktovaná verze GeForce2
  • jaro 2001, vychází převratná GeForce3
  • podzim 2001, vychází Geforce3 Ti500, tedy přetaktovaná verze geforce3 (a slabší verze Ti200 + GF2 Ti)
  • jaro 2002, vychází Geforce4, vylepšená verze GF 3

Detail kondenzátorůPodíváme-li se na první 4 řádky, došlo během 1 roku k šílenému technologickému vývoji. Poté se už zpomalil - GF2 Ultra byla víceméně jen GF2 taktovaná na vyšší frekvence. Stejná situace se opakovala u GF 3 a GF 3 Ti, ovšem teď je ona "prodlužovací" fáze rozšířená o GF 4. Rozdíl mezi ní a GF 3 se dá v podstat+ srovnat s rozdílem mezi GeForce1 a GeForce2 - ovšem tehdy tyto karty dělilo jen půl roku, nikoliv rok. Holt, nVidia zpomaluje.

Navíc GF 4 ze všeho nejvíc vypadá jako PC verze NV2A, čipu použitého pro XBox – kromě taktovací frekvence je soupis vlastnosti podezřele podobný.

Speciální pozornost také zasluhují údajně nové PS1.2 a 1.3. Když se poprvé objevila jejich specifikace, říkal jsem si "uf, nVidia to konečně prosadila u Microsoftu". Vetšina nových instrukci totiž podezřele připomínala instrukce, jež byly podle původních specifikací (nevím, jak je tomu teď) podporovány v OpenGL, ale nikoliv v DirectX. Někdy v létě jsem dokonce některé z nich testoval v detonátorech verze 14.60 a fungovaly (navzdory tomu, ze detonátory ohlašovaly podporu pouze PS1.1). Je tedy otázka, co se s těmito instrukcemi stalo a proč se neobjevily už dříve? Opět je tu několik možností:

  • Microsoft specifikaci rozšířil i o další instrukce, které GeForce3 neumí a tudíž nemůže oficiálně podporovat pixel shaders 1.2 a 1.3
  • nVidia objevila chybu v jejich implementaci a proto je nemohla zpřístupnit
  • nVidia je záměrně pozdržela, aby je teď mohla ohlašovat jako novinku Geforce4. Stejným způsobem, jako jsou 3d textury a shadow-buffer propagovány jako novinka pro Geforce3 Ti, ačkoliv jsou už na té původní.

Zatím nevíme, která z uvedených možností se ukáže jako pravdivá, ale tu třetí zatím rozhodně vyloučit nemůžeme…

A ke konečnému znechucení mě vede Geforce4 MX. Situace kolem pixel shaderu a vertex shaderu je tak trochu tradičním začarovaným kruhem - hráči nemají důvod, proč si za ně připlácet, protože je žádná hra (kromě Aquanoxu) nepodporuje. No a výrobci her nemají důvod nějak moc se na ně soustředit, protože počet hráčů s kartami s jejich podporou je malý. Najdou se výjimečné případy, které založí reputaci právě na podpoře nejnovějších technologií - byl by například Aquanox dnes tolik známý, kdyby nebyl prvním pořádným testem Directx 8? Asi těžko.

Ovšem tyto případy jsou spíše výjimečné, navíc je otázka, jak se popularita Aquanoxu jako benchmarku projevila na jeho prodejnosti. Jednou z cest jak tento začarovaný kruh prolomit je dát hráčům tyto featury jaksi "navíc" - prodávat kartu, kterou si lidé koupí kvůli výkonu, ovšem zároveň s ní dostanou i nové vlastnosti, byt' je třeba ze začátku nevyužijí. V tomto ohledu funguje výborně GeForce3 Ti, a poměrně slušně i nový Radeon.

Geforce4 MX má slušný výkon (a lide ji tedy pravděpodobně budou kupovat), ovšem nic nového nepřináší, a jen tím prodlužuje dobu, kdy jsou shadery jen něčím "navíc", co herní enginy nebudou nijak zvlášť podporovat a rozhodne ne vyžadovat. Což je škoda.

Pokud budou za chvíli hry na X-Box vypadat úžasně v porovnání s PC, nebude to proto, ze by X-Box byl tak úžasně výkonný. Bude to proto, ze všechny nové vlastnosti X-Boxu mohou jeho programátoři využít již teď. A ne za 2-3 roky…




Hlavní zprávy

Další z rubriky

Nývlt Václav: Asus ROG Zephyrus
První Max-Q notebook vysune po odklopení displeje podvozek

První notebooky s koncepcí Max-Q od Nvidie míří na český trh. První bude Asus/ROG Zephyrus, hned po něm Acer Triton 700. Oba překvapí tichým chodem při...  celý článek

Dlouho očekávané procesory AMD Ryzen 7 přišly na trh.
Nečekaný dárek. Některá šestijádrová AMD mají patrně omylem osm jader

Příjemné překvapení čekalo na některé nové majitele procesorů Amd Ryzen 1600 a 1600X. Místo slibovaných šesti výpočetních jader dostali model se dvěma jádry...  celý článek

Říjnové novinky společnosti Google
Nový reproduktor Google je jako koblížek. Notebook to umí s perem

Google Home má novou malou barevnou a velkou hi-fi verzi. Nový notebook s Chrome OS je přetáčecí a podporuje digitální pero. K tomu firma ukázala vlastní...  celý článek

Vyfoťte, vystavte, prodejte
Vyfoťte, vystavte, prodejte

Prodávejte jednoduše přes mobilní aplikaci Bazar eMimino.cz.

Najdete na iDNES.cz



mobilní verze
© 1999–2017 MAFRA, a. s., a dodavatelé Profimedia, Reuters, ČTK, AP. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s., zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s., se sídlem
Karla Engliše 519/11, 150 00 Praha 5, IČ: 45313351, zapsaná v obchodním rejstříku vedeném Městským soudem v Praze, oddíl B, vložka 1328. Vydavatelství MAFRA, a. s., je členem koncernu AGROFERT.