V samotných počátcích internetu se čeští uživatelé začali smiřovat s tím, že budou psát bez háčků a čárek (a kroužků). Bylo to nejjednodušší řešení, dostupné každému kdykoli. Jakékoli jiné pokusy obvykle vyústily v problémové přepínání znakových sad a vedly k nevrlým reakcím. Pravidlo o psaní bez diakritiky se tak dokonce dostalo i do některých netiketových předpisů a doporučení. Tyto příručky doporučovaly psát webové stránky zcela bez háčků a čárek.
Také úvodní stránka iDNES.cz spuštěná před deseti lety musela na problémy s diakritikou pamatovat. Čtenářům jsme tehdy nabízeli několik možností, jak stránku korektně zobrazit, aby se místo některých písmenek neobjevoval rozsypaný čaj. Zpočátku se ale diakritika mohla objevit jen v obrázcích, texty byly bez hacku a carek.
Radikálnější uživatelé a odborníci dokonce volali po naprostém zákazu diakritiky, případně po vrácení se k takzvanému spřežkovému pravopisu z doby před Janem Husem. Naštěstí se většinou jednalo jenom o recesi. Vtipné řešení nabídl i neznámý autor "Omluvy Jana Husa." Tento fiktivní dokument má jednu zvláštnost. Neobsahuje ani jedno oháčkované nebo očárkované písmeno.
"Omluva Jana Husa za pravopis pln chmur"Krajani a druzi moji, (dopis koluje po internetu v různých zněních, toto jsme našli zde, autora se nám nepovedlo zjistit, přihlásí se nám?) |
Český unikát, abeceda jako žádná jiná
Jestlipak víte, kolik písmen má česka abeceda? Schválně teď na chvíli přestaňte číst a zkuste si to v duchu spočítat. Nezapomeňte na žádnou souhlásku nebo samohlásku, prostě si přeříkejte celou abecedu. Nepodvádějte.
Tak co, kolik vám vyšlo? Pokud jste nezapomněli na to, že písmeno "u" můžeme psát s čárkou i kroužkem, písmeno "e" s háčkem i čárkou, dvojznak "ch" se počítá jako samostatné písmeno, a pokud jste oháčkovali a očárkovali všechno, co jde, vyšlo vám číslo 42. Důvodů, proč má česká abeceda tolik písmen, je více a nejsou tak jednoduché, jak by se mohlo zdát.
V naší abecedě tedy máme o plných šestnáct znaků více než v abecedě anglické. Problém nastal ve chvíli, kdy se písmena již nerodila jen z brků, per, štětců a tužek vedených lidmi. S příchodem knihtisku a později psacích strojů začali Češi zjišťovat, že ne každé zařízení je jejich jazyku přizpůsobené. A s nástupem elektronického věku se zdálo, že se budeme muset našich jedinečných znaků vzdát.
Možná vás překvapí, že "ta diakritika" je přísně vzato množné číslo slova středního rodu "to diakritiko". Toto slovo, skloňované podle vzoru město, označuje čárku, háček nebo kroužek nad písmenem, tedy diakritické znaménko. Protože se v praxi běžně používaly věty jako "chybí diakritika" nebo "je třeba doplnit diakritika" (chybí znaménka, je třeba doplnit znaménka), časem slovo diakritika přešlo do slovní zásoby a zdomácnělo v ženském rodě. Tak můžeme používat spojení "s diakritikou" a "bez diakritiky" bez obav, že bychom způsobili zmatky. Zkuste naopak použít slovní spojení "bez diakritik" a "s diakritiky" a dočkáte se... bezdůvodné kritiky.
Elektronické národní obrození
Je pochopitelné, že ani při vzniku prvních počítačů schopných pracovat s textem se na naše unikátní písmenka nepamatovalo. V tu dobu byli všichni rádi za těch 26 písmenek anglické abecedy a desítky dalších znaků – symbolů a čísel, které se na prvních obrazovkách objevovaly.
Vývoj ostatně probíhal především v amerických společnostech a univerzitách, které neměly důvod zahrnout do svých znakových tabulek podivná písmenka s parazity, které používá jakýsi nárůdek kdesi za železnou oponou.
Znakové sady postupně přicházely s podporou dalších znaků. Čeština ale stále nepatřila mezi nabízené. US-ASCII, jejíž kořeny sahají až do roku 1960, pro nás byla příliš těsná. Mimochodem, tuto znakovou sadu dokonce podpořil v březnu 1968 i prezident Spojených států Lyndon Johnson, když pronesl: "All computers and related equipment configurations brought into the Federal Government inventory on and after July 1, 1969, must have the capability to use the (American) Standard Code for Information Interchange and the formats prescribed by the magnetic tape and paper tape standards when these media are used."
Naše znaky se vešly až do normy ISO-8859-2 (ISO Latin 2), která přišla teprve roku 1987.
České informatice vytrhli trn z paty i slavní bratři Kameničtí, kteří přišli s vlastním kódováním, či spíše chytrou nadstavbou již existujícího kódování CP437. Znaky 128 až 171 nahradili znaky české a slovenské abecedy. O funkčnost se staral na pozadí běžící program KEYBCS2, podle kterého se také někdy kódování přezdívalo. Výhoda kódu Kamenických spočívala v tom, že pro náhradu znaku hledali vždy symbol podobný tomu českému, a tak i v případě nemožnosti implementace převodníku byl text jakž takž čitelný. Pamětníci si jistě pamatují Kamenické z T602 a dalších editorů. Teprve s rozšířením Windows 95 se toto neoficiální kódování vytratilo.
V současné době se pro kódování češtiny používá nejčastěji Windows-1250, ISO 8859-2 a UTF-8 (Unicode). Kromě toho má HTML vlastní způsob, jak převést české znaky do kdekoli zobrazitelné podoby, a to konverzí na HTML entity, ovšem s tou nevýhodou, že činí nepřehledný a needitovatelný HTML kód. Více o kódování češtiny na webu najdete na starším, ale stále oblíbeném serveru jakpsatweb.cz Dušana Janovského.
Bez hacku a carek to jde taky
Dokud byl v kódování neúnosný zmatek, obsahovaly mnohé netiketové poučky z počátku devadesátých let i prosbu: "Piste bez diakritiky." Usenetove diskusní skupiny jsou možná dodnes důvodem (nebo přinejmenším počátkem toho), proč nám nepřijde divné, když čteme v diskuzi "autore, jdi se vycpat!" namísto...
To nebyl dobrý příklad, ale víte, co mám na mysli. Schválně, napište nám větu, která bude mít velmi odlišné významy v závislosti na různě doplněné diakritice. Určitě nějakou takovou znáte ze svého denního smskování.
"Ja se ucim hackovat jako Kevin Mitnick!"
"To me naucila hackovat babicka."
S příchodem webových stránek bylo potřeba nějak vyřešit problém různých přístupů, které k českým znakům zaujali výrobci softwaru. V dnešní době už se naštěstí s chybným kódováním setkáme na internetu jen výjimečně, ale není tomu tak dávno, kdy čtení českých stránek se správně zobrazenou diakritikou znamenalo luxus.
Jak si poradit s rozsypaným čajem
I dnes, kdy existují výborná technická (a standardizovaná) řešení pro českou diakritiku, se mohou s nabodeníčky vyskytnout problémy. Ať už jde o dennodenní trápení webdesignérů a kodérů, kteří se snaží automatizovat převod uživatelem vloženého textu v kódování Windows 1250 do MySQL záznamu v Unicode a pak jej zobrazit v prohlížeči ve znakové sadě ISO... Nebo nefunkční titulky pod filmem, kde se naše milovaná diakritická znaménka mění v cosi, pro co se vžil termín "rozsypaný čaj".
Dokonce ještě dnes se stává, ze e-mailová zpráva, kterou pošlete, po cestě díky nějakým špatně nastaveným převodníkům zmutuje v nečitelnou změť. A co teprve ty tisíce fontů, které byste ve svém grafickém výtvoru tak rádi použili, ale nemůžete, protože místo "protože" se zobrazuje "proto?e"? Mimochodem, mnoho užitečných informací o tvorbě českých fontů najdete na stránkách Diacritics.
Proč vlastně stále trváme na diakritice? Jednoduchá odpověď by mohla znít, že nám nabodeníčka přirostla za těch 600 let k písmenkům i k srdci. Není také pochyb o tom, že text s diakritikou se snáze čte, mozek totiž nemusí doplňovat háčky a čárky, nemusí zvažovat různé varianty. Možná také chceme znesnadnit cizincům jejich odhalování tajů češtiny. Důvody jsou tu ovšem i ryze praktické - text bez diakritiky zkrátka nemůžete použít ve formální nebo obchodní korespondenci, a vlastně nikde tam, kde se po vás vyžaduje spisovná čeština. Jistě nezanedbatelnou připomínkou je i to, ze text bez diakritiky zní při automatizovaném převodu do mluveného slova dost příšerně, a jde tak o výraznou překážku v přístupnosti dokumentů zrakově postiženým.
Ohákněte váš text
Pomocnou ruku při boji s diakritikou k vám natahují mnohé freeware programy. Já osobně používám PSPad, který existuje i v portable verzi. Umožňuje převod mezi různými znakovými sadami. Dokáže také z textu odstranit diakritiku. Dokonce, pokud doinstalujete česky slovník, se PSPad pokusí diakritická znaménka do vašeho textu doplnit (Úpravy, Konverze, Doplnit diakritiku). Pro automatické nebo poloautomatické doplnění diakritiky se dá do jisté míry využít i toto makro pro MS Word sestavené Jakubem Vránou.
Doplnění diakritických znamének do textu je velice praktické, zvláště pokud používáte nebo jste nuceni používat pro textový vstup zařízení, které diakritiku vkládat neumí. Typickým příkladem jsou mobilní telefony s klávesnicemi QWERTY (na jednom takovém z experimentálních důvodů sepisuji i tuto část článku). Text bez diakritiky je ještě s přimhouřením oka přípustný v rychlém sledu vyměňovaných e-mailech, ovšem delší nebo formálnější text je vhodné posílat s háčky a čárkami (a kroužky, samozřejmě). Pro rychlé doplnění diakritiky nejen do ANSI textu doporučuji všem uživatelům webovou službu Ohákování, kterou vyvíjejí na Masarykově univerzitě. Stačí vložit text, odeslat a vzápětí se objeví tentýž text, ovšem s diakritikou. Převod není dokonalý, ale ušetří velké množství práce. Pečlivá kontrola je přesto nutná, program zatím zřejmě pracuje jen na principu četnosti jednotlivých variant slov, nesrovnává tedy slovní spojení a nebere v úvahu gramatiku. Mimochodem, v tomto odstavci jsem musel dodatečně upravit více než deset písmen.
Historie české diakritiky |
Na historický vývoj české diakritiky jsme se ptali v Poradně Ústavu pro jazyk český. Jakým vývojem prošla diakritika v historii? Kdy se poprvé objevila v té podobě jako dnes a kdo ji má na svědomí? Český jazyk byl zaznamenáván latinkou, latinské písmo však nemělo zvláštní litery pro všechny tehdejší české hlásky. V nejstarších zápisech táž litera označovala i několik hlásek (např. c značilo k, c, č). Potřeba odlišování hlásek však narůstá, proto vzniká spřežkový pravopis (cz = č, sz = š, rz = ř), ten se užívá od počátku 14. st. Zásadní změnu vnesl Husův návrh užívat pro rozlišení rozlišovací (diakritická) znaménka. Vzniká diakritický pravopis. Hus označuje dlouhé samohlásky čárkou, ale místo háčku psal tečku. Husův pravopis se po jistém kolísání ustálil od konce 16. století, a to v tzv. pravopise (česko)bratrském. Ten byl změněn teprve za obrození na poč. 19. st. (Dobrovského analogický pravopis). Jaké jsou časté chyby či dotazy související s českou diakritikou? Nejčastěji jde o záměnu ú - ů, resp. psaní ů ve slovech, kde píšeme ú (zůčastnit se, manikůra, tůra). Někteří pisatelé váhají u označování měkkosti v případech, jako je Naďa - Nadi, Nadě, Táňa - Táni, Táně (mají tendenci psát Naďi, Táňe). Je text bez gramatických či stylistických chyb, ovšem bez diakritiky, považován za spisovnou češtinu? Ano, jedinou spřežkou v češtině je ch (spojení c a h). Proč se píše dědeček a ne ďedeček? Měkkost u souhlásek ď, ť, ň před samohláskou e se označovala háčkem nad samohláskou už v tzv. bratrském pravopisu, tedy v 16. století. Tato zásada platí stále.
Důvod pro rozlišování ů a ú je historický. Kroužek nad u píšeme pouze ve slovech domácího původu, protože pouze v nich vzniklo dlouhé ů z dvojhlásky uo (např. duom > dům, buoh > bůh) – kroužek je pozůstatkem hlásky o z dvojhlásky. Slova přejatá, např. kúra ("léčebný proces", z latiny) a túra (z francouzštiny přes němčinu), píšeme s čárkou. Za odpovědi děkujeme Anně Černé. |
Mohlo by vás zajímat:
- Zmatky s nabodeníčky (Zuzana Fialová)
- Jazyková poradna ÚČJ
- Proč se trápit s diakritikou (Dalibor Behún)
- Historický vývoj češtiny (Wikipedia.org)
- Kódování češtiny (Ondřej Bojar)
- Vysvětlení zmatků (Lukáš Petrlík)
- Kódování Kamenických (Wikipedia.org)
- Další informace (česky)
- Projekt Diacritics (anglicky)