Whetstone test měří matematický výkon
V dnešním díle testu se podíváme na to, jak notebooky zvládají matematické úlohy. Výsledek těchto testů bude zajímat (na rozdíl od včerejších méně specificky zaměřených testů obecné výkonnosti) hlavně uživatele vědeckých, inženýrských, statistických, expertních a počítačem podporovaných aplikací CAD/CAM/CAE. Testovací procedura Whetstone měří výkon matematické jednotky procesoru. (Podrobný popis testu je uveden v poznámkách na konci článku.)
V tomto srovnání je použito dvou různých variant Whetstone testu - první jednodušší spoléhá pouze na původní x86 instrukce, které podporují všechny procesory. Druhá varianta předpokládá procesor s instrukční sadou rozšířenou o podporu SSE2 instrukcí, které výrazně zrychlují náročnější výpočty. Na druhé straně, jejich nevýhoda, respektive slabá stránka spočívá v aplikační podpoře: pokud aplikace nevyužívá SSE2 instrukcí, musí si vystačit s výpočetními schopnostmi x86 instrukcí a takovou rychlostí, kterou procesor nabízí při použití pouze těchto omezenějších instrukcí. Protože SSE2 instrukce v našem srovnání podporují pouze Pentium 4 procesory, velmi záleží na konkrétní aplikaci, zda využívá rozšířené instrukční sady - pokud ano, i na pomalejším Pentiu 4 může běžet výrazně rychleji, pokud ne, nastává opačný efekt - i rychlé Pentium 4 podlehne pomalejší konkurenci.
Pořadí standardního matematického výkonu notebooků
V našem prvním srovnání uvažujeme "běžnou" výpočetní sílu procesorů, tedy bez využití rozšířené instrukční sady SSE2. Tento test udává, jak se který notebook hodí pro matematicky náročné aplikace bez SSE2 podpory.
Asi jen málokterý z uživatelů by měl pro své náročnější výpočty používat procesory Transmeta, mezi ně už se vklínilo pouze uměle zpomalené (do úsporného módu přepnuté) Pentium 4 na 1,2 GHz. Dokonce i náš pomyslný základ, několik let starý ThinkPad A20m s procesorem Celeron na 500 MHzích si zde vede lépe.
Poměrně velkým zklamáním je neoptimalizovaný výkon Pentium 4 a Celeron procesorů mezi 1,5 a 1,7 GHz, ty se skutečně nemají příliš čím chlubit. Ani jeden z nich nedokázal překonat hranici 1000 bodů. Stejně málo stojí za zmínku výkon většiny ostatních Pentium 4 procesorů.
Rychlejší jsou v této kategorii i notebooky s Pentium III-M a Celeron procesory na 1133MHz, jejich výkony se dají označit jako lepší střed, spolu se staršími mobilními AMD procesory Mobile Duron a Mobile Athlon 4.
Ten správný výkon však nastává teprve u trojice poslední - AMD Athlon XP 1800+, Pentium M na 1600 MHzích a stolní Pentium 4 HyperThreading, ti dosáhli na stupínky vítězů. Skutečným překvapením je hlavně umístění jak Pentium M procesoru, tak Pentium 4 HT - a to i přesto, že nemohou využít své hlavní síly, spočívající v podpoře SSE2 instrukcí.
Pořadí výkonu s podporou SSE2 instrukcí
Tabulka se od základu změní v případě, že bereme v úvahu podporu SSE2 instrukcí. Pak se všechny ostatní procesory s výjimkou nejrychlejších AMD procesorů odsouvají na zadní pozice, dokonce i tehdy tak pomalé Pentium 4 na 1,2 GHz je schopno držet krok s Pentii III-M na podobné frekvenci. Nic se nemění pro procesory bez podpory této technologie, Transmeta produkty stále okupují nejzadnější příčky, stará Pentia III-M si mohou stěžovat na své stáří a Athlony včetně XP žehrat na (pochopitelně) malou ochotu Intelu sdílet svou rozšířenou instrukční sadu.
Pozoruhodné je pak srovnání Pentia 4 na 2,4 GHz a Pentium M procesoru na dvou třetinovém taktu. I s tak výrazně nižším taktem dosahuje lepšího výkonu. Nesesaditelným králem však stále zůstává Pentium 4 s HyperThreading technologií. Jeho výkon je na míle vzdálen všem ostatním.
Procentní srovnání výkonu bez podpory a s podporou SSE2 instrukcí
Procenta nám jen zvýrazní některá fakta: bez podpory SSE2 se Pentium 4 procesory v základním matematickém výkonu mají problém oddělit i od Celeronu na 500 MHzích, dvojnásobku jeho výkonu a poměrně lineárního nárůstu s frekvencí pak dosahují procesory AMD, Pentium III-M a Pentium M - s tím jak roste počet MHz, roste úměrně tomu, v přímé závislosti i matematický výkon.
S tímto nám opět výrazně zamíchá podpora SSE2 instrukcí v Pentium 4 a Pentium M procesorech. Tam, kde Intel přesvědčil vývojáře aplikací zabudovat podporu SSE2 instrukcí, může uživatel čekat velmi solidní nárůst výkonu, který dokonce lehce přesahuje růst frekvence. Tradičně na ocase se drží procesory Transmeta, jejich matematický výkon je prostě směšný.
Výrazně naroste výkon v případě Pentium M a Pentium 4 HyperThreading procesorů. Oba procesory jsou i oproti ostatním Intel procesorům unikátní, jejich výkon je špičkový, u Pentium M vzhledem k frekvenci, u Pentia 4 HT je to absolutně nejlepší výkon kdy v notebooku dosažený - sedminásobek výkonu Celeronu 500 MHz mluví za vše, nárůst je zde více než lineární.
Efektivita procesorů v matematických výpočtech
Kdy roste výkon více než lineárně nám pomůže osvětlit následující tabulka. Na operační efektivnost procesorů si můžeme posvítit porovnáním výkonu k frekvenci procesoru. A výsledky srovnání efektivity (bez podpory SSE2) jsou skutečně zajímavé. Zatímco ve středu tabulky se nám sejde nepravděpodobná skupina Transmeta procesorů a Pentium 4 HT, které vykazují stejný počet MFLOPS na 1 MHz taktu (MFLOPS - milión matematických operací v plovoucí řadové čárce za sekundu), jako nejméně efektivní se jeví procesory Pentium 4. Bez podpory SSE2 instrukcí je jejich matematický výkon zjevně nedostačující.
Na opačném konci figurují procesory AMD - pokud je srovnána reálná frekvence procesoru jako v případě starších Mobile Duron a Mobile Athlon 4, pak vychází reálná efektivita srovnatelná s Pentium III procesory. Naproti tomu, jakmile začneme brát v úvahu "PR rating" novějších AMD procesorů Athlon XP, pak jejich efektivita klesá. Ale stále dosahuje hodnoty srovnatelné s Pentium M procesory.
Situace se opět výrazně změní ve prospěch Pentium 4 procesorů s podporou SSE2 instrukcí. Pak dosahují stejného počtu vykonaných výpočetních operací na jeden megahertz výkonu jako AMD Athlon XP procesory, stále ještě sice rodina Pentium III procesorů uniká, ale zcela mimo soutěžní pole se posouvá Pentium 4 HyperThreading a především Pentium M. Pentium M je s přehledem nejefektivnější, velmi solidního výkonu dosahuje i Pentium 4 HyperThreading.
Je HyperThreading skutečným zlepšením?
Sada testů Sandra je přizpůsobená pro podmínky multiprocesorového prostředí, což zcela zřetelně prospívá Pentium 4 HT. Na jeho výsledcích je to jasně vidět - zatímco běžná Pentia 4 se v efektivnosti odlišují jen minimálně, u Pentia 4 HT nejenže prudce narostla frekvence, ale dokonce se současně zvýšila i "produktivita" procesoru. Díky tomu je Pentium 4 rychlejší nadvakrát: kvůli vysoké frekvenci a kvůli paralelnímu zpracování výpočtů ve svých dvou výpočetních jednotkách. Není tak divu, že utekl jak svým soukmenovcům bez HyperThreading technologie, ale i "nebezpečnému" Pentium M procesoru. Pentium M je sice ještě efektivnější při "využívání" svých megahertz, ale chybí mu druhá ingredience - a to je takt srovnatelný s Pentiem 4 HT. Aneb, když to nemáš v hlavě, dožeň to svaly!
V matematickém testu se tak nabízí závěr hodně podobný jako u obecného výkonu procesoru. I do budoucna budou Pentia 4, tentokráte již s podporou HyperThreading technologie, kralovat co do maximálního výkonu. Milovníci vysokého výkonu a nadprůměrné mobility, tichého a dlouhého provozu si přijdou na své s Pentium M procesory, a - pokud se do Čech propracují - s výše taktovanými AMD Mobile Athlon XP-M procesory s PR ratingem 2400+ až 3200+ (i když u toho vyššího čísla, to je hudba budoucnosti, zřejmě dost vzdálené).
V zítřejším vydání multimediální schopnosti procesoru
V zítřejším díle se pokusíme zhodnotit výkon procesorů při použití multimediálních instrukcí. Tento test využívá všech předností konkrétního procesoru, je tak do jisté míry ukázkou maxima možného při využití specifik konkrétního procesoru. Zůstaňte proto s námi, zajímavá překvapení jsou nasnadě.
Legenda k tabulkám:
CPU - definuje typ procesoru použitý v notebooku v nejširším pojetí:
C - Intel Celeron, ať na Pentium III či Pentium 4 jádru
P - Intel Pentium, bez ohledu na Pentium 4 či Pentium III, nebere v úvahu mobilní či stolní odnože
T - Transmeta Crusoe
A - AMD Athlon 4 a Athlon XP procesory, bez ohledu na mobilní či stolní verzi (XP1600+ je stolní PC zařazené pro účely srovnání)
D - AMD Mobile Duron
M - Intel Pentium M
cpu - podrobný popis typu procesoru včetně operační frekvence:
C3M,5 - Mobile Celeron na Pentium III jádru, s frekvencí 500 MHz
TM58-,8 - Transmeta 5800, frekvence 800 MHz
P3M1,13-0,7 - Pentium III-M nominálně s frekvencí 1,133 MHz, přepnuté na úrovni hardwaru na úspornou frekvenci 733 MHz
P3M-,8 - Pentium III-M pracující na frekvenci 800 MHz
P4M1,7-1,2 - Pentium 4-M s nominálním taktem 1,7 GHz, přepnuté na úsporný režim s frekvencí 1,2 GHz
MD-1 - Mobile Duron, 1 GHz
C4M1,5 - Mobile Celeron na Pentium 4 jádru, 1,5 GHz
P4M1,6 - Pentium 4-M na 1,6 GHz
C4D1,7 - stolní (Desktop) Celeron na Pentium 4 jádru, 1,7 GHz
MA4-1,2 - Mobile Athlon 4, 1,2 GHz
P4D2 - stolní (Desktop) Pentium 4, 2 GHz
MAX15+ - Mobile Athlon XP 1500+
DAX16+ - Mobile Athlon XP 1600+
PM1,6 - Pentium M na 1,6 GHz
Vysvětlení Whetstone testu podrobněji
Pozn.red.: Podrobné vysvětlení k principu testování naleznete v otázkách a odpovědích, jak je uvádí autoři aplikace Sandra.
Q: What is the Whetstone benchmark?
A: The Whetstone benchmark is widely used in the computer industry as a measure of FPU or Co-Processor performance. Floating-point arithmetic is most significant in programs that require a Co-Processor. These are mostly scientific, engineering, statistical and computer-aided design programs.
The Whetstone benchmark used here is a multi-threaded, 32/64-bit variant of the original one which runs under UNIX. Up to 64 CPUs in SMP systems are supported. The result is determined by measuring the time it takes to perform some sequences of floating-point instructions. Due to various changes, the result is not directly comparable with other Whetstone benchmarks. However the MFLOPS (Million FLoating OPerations per Second) should be the same for the same system (+5-10% variation) between benchmarks.
Q: What is the SSE2 Whetstone benchmark?
A: With the introduction of SSE2 and its support for double floats (64-bit) it is now possible to write code that does not use the legacy FPU at all. This version shows that the full Whetstone benchmark can be implemented using SSE2 and thus take advantage of the SIMD mode of operation.