Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Centrum.cz likviduje spam pomocí statistiky

aktualizováno 
V prosinci konečně spustilo Centrum použitelný antispamový filtr, při stahování pošty do klientu na vašem počítači vám však Centrum doručí i odfiltrovaný spam. Naštěstí lze poštovní schránku nastavit tak, aby váš počítač byl detekovaného spamu ušetřen.
Freemail druhého nejnavštěvovanějšího českého portálu Centrum.cz nabízí svým uživatelům poměrně kvalitní antispamový filtr, jeho existenci však poměrně úspěšně tají. Místo toho inzeruje možnost přidávat jednotlivé e-mailové adresy a domény na černou listinu. Ve skutečnosti loví Centrum spam pomocí statistické analýzy textu. Identifikovaný spam je odfiltrován do zvláštní poštovní složky. Pokud stahujeme poštu z Centra do poštovního klientu na PC, můžeme si vybrat, zda máme zájem i o spam.

Portál Centrum.cz již před delší dobou halasně vypustil do světa zprávy o svém antivirovém řešení. Pokročilí uživatelé internetu však byli zklamáni, podle popisu na stránkách portálu měli pouze možnost ručně přidávat e-mailové adresy nebo celé domény (část e-mailové adresy za znakem @) spammerů na blacklist (černou listinu), přičemž kapacita blacklistu byla omezena na 100 adres nebo domén. Toto řešení bylo možno považovat za tragikomické, spammeři zpravidla e-mailové adresy falšují a jako odesilatele uvedou pokaždé někoho jiného.

Bayesovský filtr se učí, co je spam

Jedním ze slibných prostředků pro filtrování spamů se ukázala statistická analýza slov v textu. Pokud porovnáme texty legitimních e-mailových zpráv (někdy se jim říká ham, šunka) s texty otravné nevyžádané pošty (spam, podle obchodní značky levného pokrmu z mletého masa), zjistíme, že ve spamu se některá slova vyskytují častěji (Viagra, FREE a podobně). Můžeme tedy použít statistický filtr a učit jej na vzorcích obdržených e-mailů, do jaké míry je výskyt kterého klíčové slova v korelaci s legitimní pošty a spamu.

Podobné filtry většinou vycházejí z Bayesova teorému a zřejmě poprvé je navrhl Paul Graham ve svém textu A Plan for Spam. V češtině použití Bayesova teorému popsal Martin Mačok, Bayesův teorém si pak našel cestu do poštovních klientů (Mozilla Mail a Thunderbird, placená verze Eudory, Max OS X Mail) i do speciálních doplňků ostatních poštovních programů. Většina antispamových implementací Bayesova teorému dokonce umí průběžně učit sebe sama z obdržených vzorků pošty, zpřesňovat tak váhy přiřazené jednotlivým slovům a přidávat nová slova. Pokud tedy spammeři začnou nahrazovat slovo Viagra řetězcem znaků V1agra či dokocne V1@gr@, bayesovský antispamový filtr si na ně postupně přivykne

Bayesovské filtry trpí určitými nevýhodami (co když je obdržená zpráva tvořena pouze jedním velkým obrázkem), se kterými se však jejich tvůrci učí bojovat, mohou například analyzovat nejen text, ale i hlavičky e-mailu a obsah kódu HTML. Na druhou stranu mohou bayesovské filtry pracovat efektivněji než řešení na databáze poštovních serverů zneužívaných spammery či sdílení digitálních otisků spamů: Nemusejí komunikovat s centrálním serverem a vyhnou se ta prostojům způsobeným čekáním na odezvu serveru (při testech v redakci jsme u různých veřejných serverů naměřili zpoždění 0,2 až 1,7 sekund).

Velmi oblíbeným konkurentem bayesovských filtrů je expertní systém SpamAssassin, který je však vytvořen v jazyce Perl a analyzuje zprávy na základě regulárních výrazů a v důsledku toho je poměrně náročný na systémové zdroje. I SpamAssassin však nyní může volitelně jako jedno z kritérií používat bayesovský filtr.

Centrum má antispam už od prosince

V prosinci byl na freemailu portálu Centrum.cz konečně spuštěn opravdový antispamový filtr. Autoři si jako jeho základ vybrali právě Bayesův teorém, koeficienty pro jednotlivá slova jsou však stanovovány poloautomaticky a ručně korigovány. Při redakčním testu odchytil filtr na freemailu Centra zhruba 75 % spamů, naštěstí však jako spam neoznačil žádnou legitimní zprávu. Centrum.cz se nyní pokusilo ještě o antivirové řešení, kdy poštovní server zná názvy nejčastějších příloh s viry a rovnou je maže. Skutečnému antiviru se toto řešení nevyrovná, velmi však pomohlo při virových epidemiích posledních dní. Podle vyjádření Centra představovalo 30 % příchozí pošty viry, 40 % spam a pouhých 30 % legitimní zprávy.

Úspěchy antispamového filru na portálu Centrum.cz nám zůstávaly zpočátku utajeny, poštu jsme z testovací schránky stahovali pro další analýzu protokolem POP3 a server nás nechal stáhnout zprávy ze složky Doručená pošta i ze složky Spam. V menu nastavení schránky jsme sice navštívili položku nazvanou Spam filtr, filtrování nevyžádané pošty, ta nám však nabídla jen možnost přidat e-mailovou adresu na černou listinu. Námi hledaná funkce je ve skutečnosti pohřbena v menu Hlavní nastavení, kde si v položce POP3 - stahovat spamový koš můžeme vybrat, zda máme o stahování spamu zájem.

Komunikační strategie portálu Centrum.cz v posledních dnech doznala zásadních změn, marketingový ředitel Tomáš Kostrhoun rozeslal novinářům zajímavé informace o úspěších freemailu při filtrování spamů i e-mailových červů a umožnil nám kontakt s tvůrci antispamu Centra. Centrum.cz však zatím na svých stránkách existenci účinného bayesovského filtru tají.



Nejčtenější

Zabil je výbuch ruského tanku v centru Prahy. KSČ ničila životy pozůstalým

Tanky typové řady T-54/55, ten blíž k fotografovi evidentně neschopný pohybu,...

Zatímco na pražské Vinohradské třídě hořel a vybuchoval tank, zmatení ruští vojáci na Václavském náměstí zahájili palbu...

Tento pancíř dá tankistům pocit bezpečí a jistoty. Ale bude to stačit?

SMART PROTech na tanku Leopard 2

Německá firma IBD Deisenroth Engineering (IBD) představila prototyp balistické ochrany SMART PROTech pro obrněná...



Úspěšný start. Sonda míří ke Slunci tak blízko, jako žádná předtím

Úspěšný start rakety Delta IV Heavy 12.8.2018 v 9:31 se sondou Parker Solar...

V neděli ráno se ke Slunci vydala unikátní sonda Parker Solar Probe. Měla by se přiblížit k naší hvězdě podstatně blíže...

Sulfan jako lék? V lidských buňkách možná pomáhá zvrátit stárnutí

Klíč k procesu stárnutí tkví v DNA.

Tým vědců zkoumající jednu z příčin stárnutí oznámil úspěch, a to přímo na lidských buňkách v laboratorních podmínkách....

Horký nápoj vás ve vedru ochladí lépe, zjistili vědci. Ale má to háček

Horký nápoj v horkém létě?

Biologie lidského těla někdy funguje přesně naopak, než by člověk čekal. Příkladem je pití horkých nápojů v létě. Zní...

Další z rubriky

Dejte nám bankovní údaje svých klientů, žádají banky Facebook i Google

Ilustrační snímek

Korporace se snaží přemluvit velké banky, aby jim daly přístup k některým bankovním údajům a umožnily obchodovat v...

Google vás šmíruje, i když mu to zakážete. Na webu o tom dokonce lže

Google zaznamenal Historii polohy i po jejím vypnutí v menu

Kdo nechce, aby se zaznamenávala jeho poloha, zpravidla si v zařízení se systémem Android deaktivuje ukládání Historie...

Spotify testuje neomezené přeskakování reklam pro neplatiče

Aplikace Spotify.

Australští uživatelé hudební aplikace Spotify si mohou vyzkoušet přeskakování reklam. Příjemnou novinku firma...

Najdete na iDNES.cz