Jak vás ochrání antispamové filtry?

  • 14
Některé studie hovoří o tom, že na konci letošního roku bude spam představovat 98 procent veškeré elektronické pošty! K tomu, abychom v záplavě všemožných nabídek na zboží či služby nemuseli zoufale vyhledávat skutečně důležité e-maily, slouží tzv. antispamové programy.
Tyto se snaží oddělit zrno od plev – relevantní zprávy od spamu. Používají k tomu přitom celou řadu různých metod. Jednou z nejrozšířenějších je Bayesův filtr. Při jeho použití dochází ke srovnávání e-mailové zprávy se dvěma databázemi. Jedna databáze obsahuje slova vyskytující se obvykle v těle spamu, druhá databáze obsahuje slova vyskytující se v řádných zprávách. Každé z těchto slov má navíc svoji určitou váhu. Výsledkem je, že dojde k sečtení vah jednotlivých slov použitých v e-mailu a dle tohoto součtu k rozhodnutí, zdali jde o spam či nikoliv.

Bayesův filtr má zpravidla tu výhodu, že jej výrobci doplňující o funkci sebeučení. Jinými slovy: uživatel má možnost provádět zpětně opravu rozhodnutí takto vybaveného antispamového programu. Filtr pak tyto opravy bere v potaz a de facto se poučuje z vlastních chyb. Tím samozřejmě roste procento zachyceného spamu – a tím samozřejmě klesá možnost, že je coby spam označena regulérní zpráva. Problémem pro jednotlivé filtry jsou totiž třeba různé jazyky…

Vzorky jako otisk prstu

Další metodou v boji proti spamu je srovnávání s již známými vzorky spamu. Její (ne)úspěšnost je ale velmi silně závislá na kvalitě a rozsahu používané databáze. Obecně platí, že rozesílatelé spamu jsou stále vynalézavější, takže je tato metoda používána spíše jako doplňková.

Využijte proti spammerovi jeho vlastní zbraně

Naproti tomu ale velmi často dochází k využívání tzv. blacklistů (seznamů, ve kterých se shromažďují informace o známých rozesílatelích spamu). Blacklisty jsou volně ke stažení na různých specializovaných serverech (www.spamcop.net, www.dsbl.org, www.spamhaus.org aj.). Příchozí e-mailové zprávy jsou přitom srovnávány s databázemi v blacklistu. Pokud je výsledek pozitivní (tedy e-mailová zpráva přišla od subjektu uvedeného v seznamu), pak je zpráva označena jako spam. Také tato metoda má několik nevýhod, a to především malou pružnost: rozesílatelé spamu jsou schopni své IP adresy nebo domény velmi rychle měnit. A vzhledem k tomu, že tyto seznamy jsou často vytvářeny dobrovolníky, dochází často k případům, kdy se seriózní instituce dostane (záměrně nebo nedopatřením) na blacklist.

Opakem blacklistů jsou tzv. whitelisty. Tyto si zpravidla (ne vždy!) vytváří každý uživatel (resp. administrátor) sám. Jedná se o seznam korektních adres, ze kterých spam nechodí – resp. jejichž e-mailová komunikace není za spam označována. Také tato metoda je spíše brána jako doplňková, protože se nedá předpokládat, že VŠICHNI korektní uživatelé budou zařazeni ve whitelistu a že ten, kdo není ve whitelistu je automaticky rozesílatel spamu. Nicméně rozhodně urychluje práci antispamových filtrů, které se nemusejí zabývat korektní poštou.

Kromě blaclistů a whitelistů se používá i metoda tzv. greylistů. Ta pracuje na principu odložení příchozího e-mailu před doručením uživateli. Vychází z jednoduché logiky: korektní poštovní server se podle pravidel SMTP protokolu musí pokusit po nějaké době o znovudoručení e-mailu (nedostal-li zprávu o doručení). Laicky řečeno: pokud poštovní server neodešle informaci o doručení e-mailu a dostane během určitého časového limitu tuto zprávu podruhé, předpokládá se, že jde o korektní zprávu. Pokud nedojde ke druhému pokusu o doručení (programy rozesílatelů spamu jsou nastavené na co nejvyšší rychlost odesílání, takže se nějakým ověřováním nezabývají), předpokládá se, že jde o spam. Nevýhodou této metody je mj. prodleva mezi odesláním a doručením e-mailu.

Další metody provádějí např. to, že srovnávají uvedenou adresu odesílatele se skutečnou IP adresou. Pokud souhlasí, považují e-mail za korektní, pokud ne, za spam.

Nic není stoprocentní

Jak vyplývá z výše uvedených metod, každá má své přednosti, ale i nedostatky. V praxi proto antispamová řešení zpravidla nesázejí jen na jednu z nich, ale používají kombinaci několika. Výrobci antispamových filtrů přitom informují o technických podrobnostech svých řešení jen velmi obecně. Jsou si totiž vědomi toho, že zveřejnění detailů práce svých programů by obratem využili rozesílatelé spamu k úpravám svých e-mailů – a tím i k degradaci účinnosti příslušných filtrů. Pro zajímavost: v roce 2004 bylo zaznamenáno několik případů, kdy byli vývojáři antispamových filtrů osloveni s lákavými nabídkami na prodej citlivých informací. Řečnickou otázkou zůstává, zdali byli rozesílatelé spamu ve všech případech neúspěšní…

Nemáte přátele v zahraničí, mažte cizojazyčné e-maily

Mimochodem, existuje jedna poměrně jednoduchá metoda filtrování spamu (i když není pro každého). Vychází z předpokladu, že přes 99 procent spamu přichází z amerických domén (com, org, net apod.). Proto si mnozí uživatelé v poštovním klientovi nastaví, že všechny zprávy z těchto domén putují buď do specializované složky (a tady je jednou za čas projdou) nebo rovnou do koše. Tuto metodu ale mohou používat jen ti, kdo komunikují pouze v lokálním rámci (a jejichž partneři nepoužívají americké domény jako třeba hotmail.com).

Jaké triky spammeři používají? 

A jak spam překonává výše uvedené ochranné filtry a detekční metody? Třeba následujícími způsoby:

  • Vkládání množství korektního textu za vlastní informační sdělení (tedy na konec e-mailu). Korektní text samozřejmě zlepšuje „skóre“ zprávy a snižuje pravděpodobnost, že bude označena jako spam.

  • Modifikování nekorektních textů: taky jste si všimli, kolika různými způsoby lze napsat třeba slovíčko VIAGRA? (V1agra, v*i*a*g*r*a, vi-gr- apod.) Na první pohled je pro uživatele stále čitelné, ale antispamový filtr s ním může mít potíže. Pokud jej nedokáže správně identifikovat, pak samozřejmě roste pravděpodobnost, že zprávu neoznačí jako spam.

  • Často také dochází k tomu, že vlastní poselství spamu není v textové podobě, ale že má podobu obrázku – tento pak může být buď přímo v těle e-mailu nebo může být stahován z určité lokality na internetu.
  • Ačkoliv mnoha výrobci proklamovaná 99procentní filtrace spamu patří spíše do kategorie zbožných přání než konstatování reality (protože rozesílatelé spamu zkrátka nespí a snaží se na aktuální trendy reagovat), pravdou je, že antispamové řešení ušetří mnoho cenného času. Stokrát nic totiž udolalo atd.

    Tomáš Přibyl
    nezávislý konzultant v oblasti IT