RSS: Pro sdílení webového obsahu

  • 13
RSS je technologie založená na XML, která slouží k propojování webového obsahu. Web, který chce dovolit jiným webům publikovat část zveřejněných informací, vytvoří RSS dokument a registruje jej prostřednictvím RSS publisheru. RSS dokument je pak k dispozici dalším webům i koncovým uživatelům.

Už několik let začíná moje každodenní ranní snaha o získání aktuálních informací asi tak: Zapnu počítač. Rychle zkontroluji obsah své e-mailové schránky, abych zjistil, zda je v ní něco, co vyžaduje mou okamžitou reakci. Pokud nikoli, je na čase spustit webový prohlížeč a projít vybrané weby s informacemi. Některé z těch webů patří vydavatelům denního tisku, další představují diskusní fóra věnovaná zajímavým projektům, jiné prostě jen odrážejí mé zájmy.

Pokud mám moc práce a nestihnu navštívit každý z mých oblíbených webů - a to někdy dokonce i po několik dní -, začnu mít pocit, že mi něco utíká. Zdá se mi, že už nikdy nezískám všechny potřebné informace a později budu při čtení informačních zdrojů znevýhodněn tím, že mi získávané informace nezapadnou do patřičného kontextu.

Uvedenou rutinou zřejmě procházejí mnozí lidé, kteří pracují především s informacemi. Pokud máte štěstí, procházíte po ránu třeba jen půltuctu stránek. Ale zrovna tak je možné, že jich na vás čeká 40 nebo 50, podle toho, které oblasti se věnujete. A zkoumání takového množství webů, to už skutečně zabere spoustu času.

Nepomáhají ani různé pomůcky, jako například definované záložky nebo lišta s rychlými odkazy na favorizované stránky - stejně musíte každý z webů pěkně ručně projít. Všechny stránky se musejí nahrát, vy si musíte uvědomit, jak je která z nich naformátovaná, kde jsou jaké informace a které z nich jste četli, když jste tu byli naposledy. Neexistuje přece jen nějaký lepší způsob, jak se s tímto úkolem vypořádat?

RSS

Řešení výše uvedeného problému nese název RSS. Je výsledkem práce společnosti Netscape Communications, která vyvrcholila již v roce 1999 spuštěním portálu My.Netscape.com. (A co znamená zkratka RSS? Na to existuje několik různých odpovědí. Více ve vloženém textu.)

RSS je formát založený na standardu XML. Smyslem jeho existence je umožnit snadné sdílení titulků zpráv a dalšího webového obsahu. RSS dovoluje softwaru automaticky stáhnout informace, které uživatelé chtějí, a porozumět jim; umožňuje sledovat a personalizovat nejrůznější data, o které se zajímají.

Zatímco HTML je navrženo za účelem prezentace informace přímo uživatelům, RSS představuje automatizovaný mechanismus vhodný pro počítače -- umožňuje jim snadno a efektivně komunikovat spolu navzájem. RSS kanál vám pak dokáže sám sdělit, pokud byl nějaký web nedávno aktualizován.

Weblogy a portály

RSS je technologií, která umožňuje fungování mnohých weblogů a portálů, například My Yahoo. I větší firmy si brzy povšimly, že se RSS velmi rychle prosazuje -- a že umožňuje snadnou výměnu a distribuci obsahu. Proto mnohé významné zpravodajské weby, a to včetně například The New York Times, BBC, CNN nebo Technetu, Mobilu či celého iDnesu (http://servis.idnes.cz/rss.asp?c=technet, http://mobil.idnes.cz/win/day_rss.html a Seznam všech RSS kanálů serveru iDnes) vytvořily své RSS kanály, aby zvýšily viditelnost svého obsahu.

RSS řeší mnohé problémy, kterým čelí dnešní webmasteři a osoby zodpovědné za firemní weby obecně. Pomáhají totiž mimo jiné zvýšit provoz na jejich stránkách (prostřednictvím sdílení odkazů na obsah) nebo zajistit sběr a distribuci zpráv. RSS může sloužit rovněž jako základna pro distribuci dalších druhů obsahu.

Jak RSS pracuje

Práce RSS začíná nad původním webem, jehož obsah je obecně dostupný a má být sdílen. Na webu je vytvořen RSS kanál (označovaný rovněž pojmem RSS feed), který je dostupný stejně jako jakýkoli jiný soubor na webovém serveru. Web registruje tento kanál ve formě RSS dokumentu v adresáři RSS vydavatelů.

Jakmile je jednou RSS kanál dostupný na webu, jakýkoli web může pravidelně stahovat jeho obsah. Nejobvyklejší typ softwaru, který takovou činnost provádí, je označován jako agregátor nebo reader zpráv.

Programy tohoto typu také dovolují uživatelům sbírat informace z mnoha různých zdrojů, které si vyberou. Mají tak k dispozici jednu jedinou aplikaci, která pravidelně kontroluje vybrané RSS kanály a zvýrazňuje nový materiál.

Standardní i nestandardní RSS

Zkratka RSS představuje zastřešující termín, který zahrnuje minimálně 7 verzí dvou rozdílných, paralelně existujících formátů. Navzdory společnému názvu mezi nimi zuří lítý politický boj.

Původní RSS (označovaný jako RDF Site Summary) verze 0.90 byl navržen společností Netscape. Ta využila IETF (Internet Engineering Task Force) specifikace RDF (Resource Description Format), která definovala formát pro tvorbu portálů obsahujících titulky ze zpravodajských webů.

V Netscapu se brzy rozhodli, že jde o příliš komplexní řešení a nabídli jednodušší verzi, označovanou jako RSS 0.91 (první písmena zkratky měla nyní označovat slova Rich Site Summary). Krátce poté firma Netscape ztratila zájem o budování portálů a celý projekt pustila k vodě.

Potom přišla na scénu společnost UserLand Software, nezávislý vývojář produktů pro blogging. Ta přijala verzi 0.91 jako základ pro své produkty -- RSS pro ní znamenalo Really Simple Syndication. Tento formát se stal docela populárním hlavně uvnitř komunity bloggerů.

V roce 2000 se objevila nová zájmová skupina RSS-DEV, která se rozhodla rozšířit RSS tak, aby obsahoval více dat. Vrátila se k základním principům syntaxe RSS 0.90 -- s prostory jmen XML a s důrazem na modularitu a rozšiřitelnost. Skupina RSS-DEV publikovala draft navrhované specifikace RSS 1.0. A tehdy začaly hádky.

Zakladatel společnosti UserLand Software, David Winer, se návrhu nového formátu neúčastnil a následně vyjádřil velmi důrazný nesouhlas se směrem, kterým se vydal. Byl naopak zastáncem dalšího zjednodušování.

Proto Winer nakonec navrhl, aby si skupina RSS-DEV vybrala pro svou specifikaci jiné jméno, čímž by se předešlo možnému konfliktu. RSS-DEV ale na názvu standardu z pochopitelných důvodů lpěla. Společnost UserLand tedy pokračovala ve vývoji RSS svým směrem, a to přes verze 0.92, 0.93 a 0.94. V roce 2002 Winer přišel s RSS 2.0. Skupina RDF následně přišla se specifikací 3.0.

Zmatek nad zmatek

RSS 1.0 není novější verzí RSS než 0.91, stejně jako není RSS 2.0 pokračovatelem RSS 1.0. RSS je technologií, která umožňuje fungování mnohých weblogů a portálů.

RSS 1.0 tak není novější verzí RSS než 0.91, 0.92, 0.93 nebo 0.94, stejně jako není RSS 2.0 pokračovatelem RSS 1.0. Navzdory tomu, že ve všech případech jde o potomky originální verze 0.90 Netscapu. Je to nepříjemný zmatek.

V roce 2003 byla ve snaze dostat se ze současné situace zformována pracovní skupina IETF, která má za úkol vytvořit nový weblogový a syndikační formát, který je označován jako Atom (dříve byl znám rovněž pod jménem Echo). První pracovní draft Atomu by měl být publikován v srpnu tohoto roku. Výsledkem by měl být rozšiřitelný standard nezávislý na výrobci, který bude jasně a pečlivě specifikovaný a vhodnější pro pro blogování a archivování. 

Nové stránky Computerworld.cz.