Spor o megabajt aneb není milión jako milión

  • 25
Víte, proč se vám pevný disk s udávanou kapacitou 20 GB hlásí po připojení do počítače jako disk s úložným prostorem 18,5 GB? Kam se ztrácí rozdíl? Ten spočívá jen v tom, jak počítá počítač a jak lidé.
Již na základní škole jsme se učili, že předpona „kilo-„ znamená jeden tisíc a „mega-„ jeden milión určitých jednotek. V počítačové oblasti však pracujeme s dvojkovou soustavou. Vedle označení kapacity MB a kB se tak můžeme setkat například i s MiB či KiB.

Zmatek, který může vládnout v označení tisíců, miliónů a dalších násobků datových jednotek, je tak většinou vyvolán tím, že míchá dvojková a desítková soustava bez předchozího upozornění.

Bit a Bajt

Základem každého počítače je polovodič, který buď umožní propouštění elektrického proudu nebo mu zamezí. Pro každý z těchto dvou stavů lze použít jednoduché označení: propouštění (1), zamezení (0). Poznatek o tomto stavu lze pak považovat za jednotku informace. Tato jednotka informace nese označení bit (b). Z toho také vyplývá, že počítač pracuje s daty uloženými v podobě jedniček a nul, tedy v dvojkové soustavě.

Osm bitů pak tvoří jeden bajt (ang. Byte, označení B). Jedním bytem lze přitom ve dvojkové soustavě vyjádřit právě jeden znak či kód v takzvané rozšířené ANSI (America National Standards Institute) ASCII (American Standard Code for Information Interchange) soustavě. Ta obsahuje celkem 256 (0-255) pozic pro písmena, znaky, čísla, kódy a další, což se dá vyjádřit také jako 28. Jinými slovy v dvojkové soustavě získáme kombinací jedniček a nul v osmi pozicích (bitech) všech 256 součástí rozšířené ANSI ASCII tabulky.

Kilo, mega, giga, …

Pokud se pohybujeme v desítkové soustavě je každému jasné, že se 103 označuje jako kilo (k) a 106 je mega (m). Jak to ale vypadá při přechodu na dvojkou soustavu? Na jedno „kilo“ potřebujeme 210 – tedy 1024 - jednotek. Pro toto „informační“ kilo se pak vžilo označení velké K na rozdíl od malého k, které platí pro desítkovou soustavu. Mega (M) v dvojkové soustavě náleží hodnotě 220 a odpovídá 1 048 576 jednotkám.

To je tedy zažité a často porušované pravidlo o označování násobků kapacit. Avšak již v roce 1998 ustanovila organizace IEC (International Engineering Consortium) speciální binární přípony, které měly přinést oficiální označení a pořádek. Bohužel se zase až tak neujaly. Proto se dnes jen zřídkakdy setkáte s označením Ki (kilobinary, kibi), Mi (megabinary,mibi), Gi (gigabinary, gibi), Ti (terabinary,tibi) a tak dále. Přitom tato označení jsou v podstatě jediná správná. Zvyk je ale železná košile. V podstatě tak například pro označení kilobajtu tedy 1024 bajtů existují dvě možnosti: oficiální KiB a neoficiální, ale zažité KB.

Výrobci disků rebelují

Doposud jsme se zabývali spíše názvoslovím a zkratkami, které lze při počítání informací využít. Mnohem větší problém než s jejich dodržováním, se však objevil v okamžiku, kdy se začaly míchat kila a mega z desítkové soustavy s těmi ze soustavy dvojkové.

Nejvýrazněji se tato praxe projevila u výrobců pevných disků. Podíváte-li se například na stránky společnosti Seagate, zjistíte, že se hlavní výrobci pevných disků dohodly na označování, které využívá desítkovou soustavou. Důvodem je prý snaha o zpřístupnění informace o kapacitě jimi dodávaných pevných disků co největšímu okruhu uživatelů, tedy i těm, kdo jsou zvyklí na standardní fyzikální přepony. Dá se však spekulovat, že mnohem závažnějším důvodem je možnost označit produkt co nejvyšší kapacitou. Poněkud se však zapomíná na správné značení a klidně se používají zkratky s velkým písmenem, které je určeno pro binární oblast.

To je také důvod, proč například pevný disk, který má podle označení 20 GB (správně by mělo být 20 gB), po instalaci v počítači zobrazí kapacitu zhruba 18.6 GB. Operační systém totiž počítá binárně a tak fyzických 20 miliard bajtů (20 x 109) přepočítá podle gigabajtu dvojkového, tedy 230 (1 073 741 824 bajtů). Výsledek rovnice (20 x 109) : (230) pak vychází na cca 18,626 GiB či GB.

Co na to uživatel?

Podobných „nepřesností“ v označování se však nedopouštějí jen výrobci disků, ale i některé další společnosti, které vyrábějí vysokokapacitní záznamová zařízení, jako je například paměťová karta. Pro běžného uživatele je však místo handrkování se o počítání množství bitů a bajtů důležitější, kolik prostoru má pro svá data. A vzhledem k tomu, že snad všichni výrobci pevných disků a i dalších záznamových zařízení používají stejnou metodiku, nemusí se bát, že by byl v něketrém případě ošizen nebo mohl naopak vydělat.