Konference VeemON 2015 Las Vegas.

Konference VeemON 2015 Las Vegas. | foto: Veeam

Tři, dva, jedna a máte problém. Nebo také ne, pokud zálohujete správně

  • 14
„Omluvte výpadek.“ Informace, se kterou se setká každý. Ať už jste zákazníkem mobilního operátora, nebo jen chcete nakoupit v e-shopu. Dočasná nebo trvalá ztráta dat však nemusí končit jen nedostupností služby. Zálohou a obnovou dat se zabývá řada firem. Jednou z největších i u nás je Veeam Software.

V roce 2005 začala virtualizace měnit IT do podoby, jakou známe dnes. Jako jedna z prvních začala virtualizaci serverů nabízet společnost VMware společně s Microsoftem, Citrixem a dalšími. Běžné datové centrum tehdy využívalo své servery v průměru na osm procent. Jinými slovy, většinu času zůstávalo 92 % výkonu serverů nevyužitých. Právě to razantně změnila virtualizace, která umožnila zásadně lepší využitelnost hardwarových prostředků (na jeden skutečný server je možné nainstalovat několik virtuálních/softwarových serverů).

Co je to Veeam

Mezinárodní společnost Veeam Software se sídlem ve Švýcarsku a Rusku začínala v roce 2005 s doslova pár zaměstnanci, dnes pro ni pracuje téměř 2000 lidí po celém světě.

V listopadu proběhla v Las Vegas konference VeeamOn, které se měl Technet.cz možnost zúčastnit. Před dvěma týdny také společnost oznámila otevření nového centra pro výzkum a vývoj (R&D Center) v Praze. Nové vývojové středisko pomůže s vývojem služby pro více než 168 tisíc zákazníků po celém světě. V čele společnosti stojí od samého začátku Ratmir Timashev.

S výraznou úsporou nákladů a již zmíněným ekonomičtějším využíváním výkonu se však objevil i problém. Jak takovéto virtualizované stroje (virtualizované aplikace a data) zálohovat a hlavně, jak jejich funkčnost co nejrychleji obnovit v případě poruchy, výpadku, atd. Žádná banka, herní portál e-shop, nebo třeba státní úřad ve vyspělém státě si nemůže dovolit výpadek serverů na několik hodin. Tyto výpadky se přitom samozřejmě dějí a je tedy nutné zajistit, aby návrat do normálního provozu byl co nejrychlejší nebo lépe řečeno okamžitý.

Právě tehdy nastupují speciální zálohovací systémy, například řešení Veeam. To používá například i Česká televize, která si výpadek v internetové nabídce nemůže dovolit. Kvůli neustále se zvyšujícímu zájmu musela také přejít z klasických serverů do virtualizovaného prostředí s VMware clustery a několika stovkami virtuálních serverů. Součástí řešení jsou i servery poskytující televizní vysílání v Praze a v Ostravě a v plánu je integrace Brna. Řešení, které televize používá, musí být schopné při havárii obnovit ze zálohy stovky terabajtů dat do několika málo minut.

Jak dlouho můžete čekat?

Nejen Veeam

Systémů zálohování pro datová centra a on-line služby je celá řada. Ve článku píšeme o Veeam, jejichž konference jsme se zúčastnili a ze které jsme informace čerpali.

Vhodnost či nevhodnost konkrétních řešení se odvíjí od konkrétního systému, který má být zálohován.

VMware změnil strategii IT. Veeam pak v roce 2006 pomohl změnit způsob, jak se data ve virtuálním prostředí a později i v cloudu nejen zálohují, ale hlavně to, jak se obnovují. Zajišťuje jak dostupnost dat na úrovni aplikací, i na úrovni samotných dat. Tuto schopnost systému udává parametr RTPO (Recovery Time and Point Objectives).

Zjednodušeně řečeno jde o to, za jak dlouho zákazník (banka) potřebuje mít systém od okamžiku výpadku opět funkční a jak hluboko do minulosti musí každá aktuální záloha dat jít, aby nedošlo ke ztrátě informací. Jinými slovy, parametr obnovy (viz boxík Zkratky... ) si nastaví každý zákazník podle toho, jak dlouhý výpadek IT si může dovolit a o kolik nejaktuálnějších dat může přijít, aniž by to ohrozilo jeho živobytí a jeho klienty. To, co dříve trvalo hodiny, dnes lze zvládnout běžně pod 15 minut. Některé české banky, které řešení Veeam používají (z pochopitelných důvodů nemůžeme jmenovat), počítají s výpadkem ne delším než tři minuty.

Zkratky obecně používané při zálohování a obnově dat

RTO = za jak dlouho bude systém obnoven

RPO = jak moc aktuální (nová) data musí v záloze být. Z toho plyne i četnost záloh - např. každých 15 minut. Vedle toho je samozřejmě možné držet i kompletní dlouhodobou zálohu.

RTPO do 15 minut = do 15 minut jsou obnovena všechna data stará maximálně 15 minut. Tak rychlá obnova neohrozí chod firmy. Starým způsobem by bylo při výpadku nutné obnovit například celou týdenní zálohu, což by trvalo 20 hodin.

Dříve (a někde i dodnes) se servery zálohovaly ve večerních hodinách v průměru čtyři až osm hodin a plná záloha se dělala přes víkend a trvala běžně i 12 hodin (samozřejmě v závislosti na objemu dat). Když uvážíte, že celou tu dobu jsou data nedostupná, je zřejmá nevýhoda tohoto řešení. Po nástupu řešení typu Veeam se běžná záloha odehraje za 15 minut a plná za dvě hodiny. Díky virtualizaci navíc celý proces může běžet na pozadí, takže data jsou dostupná stále.

Zásadní zkrácení procesu zálohování bylo možné díky inovacím v šifrování, kompresi, duplikaci a deduplikaci dat. Deduplikace zabraňuje ukládání stejných datových bloků, což redukuje objem zálohy a samozřejmě následně i čas potřebný k případné obnově. Funkci přesně popisuje heslo na Wikipedii: „Deduplikační jednotka ukládá informace (referenční informace) o datové struktuře a díky tomu je schopná při zpětném čtení deduplikovaných dat zpět obnovit původní, komplexní informaci.“ Zjednodušeně řečeno, potřebujete-li zazálohovat (uložit) tisíckrát stejný soubor o velikosti 1 MB, uložíte jej pouze jednou a v ostatních případech na originál „jen“ odkazujete. Pokud dojde ke změně originálu, ukládáte zase pouze vzniklé rozdíly.

Systém samozřejmě musí být schopen vyhodnotit (vypočítat), co uložit a co ne v reálném čase. „Data jsou deduplikována ještě před uložením na cílové úložiště v reálném čase. Vyhodnocuje se přítomnost datového bloku na úložišti, a pokud již existuje, nezapíše se. Pouze je vytvořena reference na datový blok v deduplikační jednotce,“ vysvětluje heslo na Wikipedia.org.

Systém samozřejmě automaticky testuje obnovitelnost záloh a replik při každém zálohování. Tím administrátorům a správcům odpadla další část zdlouhavé agendy. Každou zálohu je totiž nutné testovat v čase, zda je skutečně funkční. Zálohovací program toto dokáže udělat automaticky nebo na vyžádání a vydat varování, v případě, že úbytek dat je už takový, že by hrozila ztráta informace a je potřeba zálohu obnovit.

Celá (denní) záloha může mít například v bance i několik terabajtů. Obnova takového množství dat samozřejmě trvá několik hodin. Veeam však umí skrze takzvaný Explorer najít chybu přímo v rámci jednotlivých aplikací. Pozná, kde přesně došlo k pádu, a dá povel obnovit pouze tuto poškozenou část.

Ratmir Timashev (vlevo), zakladatel a šéf společnosti Veeam Software.

Takovýmto způsobem lze například v rámci velké korporace rychle obnovit uživatelům důležité části e-mailové schránky bez toho, aby bylo nutné oživit celou obrovskou databázi. Explorer totiž umí v záloze hledat doslova položku po položce. Může najít konkrétní e-mail a obnovit třeba jen konkrétní jednu přílohu.

Výše popsaný postup vychází z logiky, že v případě havárie nepotřebuji ihned všechna data ze zálohy, ale jen pouze relativně malou část (například data týkající se klientů, kteří právě stojí u přepážky).

3 - 2 - 1 záloha nebo problém

Při zálohování dat platí jednoduché, ale ne vždy dodržované pravidlo, které lze shrnout do „šifry“: 3 - 2 - 1. Do češtiny přeloženo to znamená: Pořiďte si tři kopie dat, uložte je na dvě místa, z nichž jedno by mělo být uloženo mimo budovu, kde se nachází první kopie. To samozřejmě platí nejen pro firmy, ale pro kohokoliv, kdo chce například své digitálně uložené fotografie ukazovat i vnoučatům za dvacet let.

Podmínka, že druhá kopie by měla být mimo budovu, je důležitá a často opomíjená. „Není neobvyklé, že klient si druhé diskové pole uloží jen třeba do jiné místnosti téhož podzemí,“ podotýká Ondřej Vlach, manažer pro partnery společnosti Veeam. „Pak samozřejmě stačí jedna živelná pohroma a vše je ztraceno.“

Záloha dat vypadá následovně. Nejprve je takzvaná primární záloha, nad kterou přímo běží systémy a aplikace firmy. Sekundární záloha se pravidelně kopíruje na další disky a třetí záloha se obvykle prováděla (a někde stále provádí) na magnetické pásky. Třetí kopie slouží pro případ velkých nehod a primárně se nepočítá s tím, že by data zde uložená musela být rychle dostupná. Právě proto se zde uplatnily magnetické pásky, které jsou sice velmi spolehlivé z pohledu „trvanlivosti“ dat, ale jen velmi obtížně si lze představit nějaké rychlé vyhledávání nebo obnovení systému.

Pásky jsou pomalu vytlačovány cloudovým řešením, které umožňuje rychlou a levnou zálohu (a následné obnovení dat) zcela mimo infrastrukturu firmy, u jiného poskytovatele. Pochopitelně existují data a firmy, které se takovémuto postupu logicky brání (banky, pojišťovny, atd.). Právě u nich stále přežívají pásky. V takovém případě vzniká něco jako „analogový cloud“, kdy jsou pásky fyzicky odváženy do bezpečí mimo sídlo firmy. Zálohování na pásky však má ještě jedno specifikum. Aby provozovatel měl jistotu, že záloha na nich je stále funkční, měl by je za tímto účelem pravidelně testovat. To se však podle zkušeností Ondřeje Vlacha ne vždy děje. Taková činnost je totiž časově a tím i finančně náročná.

Cloud s sebou přinesl i dosud nemyslitelné řešení krizových situací. Představme si opět výpadek systému, tentokrát třeba u úplně malého e-shopu těsně před Vánoci. To, co by dříve vyžadovalo příjezd techniků na místo, se dá nyní vyřešit po telefonu. Pokud má majitel e-shopu data zálohována v cloudu, stačí se spojit s firmou, která zálohu provozuje, a ta je schopna celý systém opět „nahodit zpět“. Nebo ještě jednodušeji: stačí zmáčknout doslova pár tlačítek v aplikaci Veeam Backup & Replication a přes cloud si obnovíte data z cloudu sami. Mezitím je možné pracovat na opravě.

Podle Ondřeje Vlacha se ukazuje, že mnohem větším nebezpečím pro únik dat není ani tak jejich teoretická krádež při přenosu do datacentra nebo přímo z uložiště v datacentru (cestou tam i ven jsou bezpečně kryptována), ale samotní administrátoři v postižené firmě. Právě na jejich úrovni dochází podle Vlacha nejčastěji k únikům.