Virtualizace ukládání dat: Úložná kapacita ze zásuvky

S nástupem prvních sítí SAN založených na technologii Fibre Channel v letech 1997-1998 začali dodavatelé systémů pro ukládání dat razit heslo Storage as Utility;. Nicméně v té době byla existující řešení od naplnění tohoto označení ještě na míle daleko. Teprve dnes, o šest či sedm let později, jsou skutečně k dispozici nezbytné metody a technologie.

Zdroje pro ukládání dat a související služby budou pro interní i externí uživatele či zákazníky výpočetních center brzy automaticky vyvolatelné, měřitelné a také zúčtovatelné stejně jako třeba voda z kohoutku nebo proud ze zásuvky. Ačkoliv to zní docela jednoduše, realita je poměrně složitá. Mnohé z dosud izolovaných funkcí systémů pro správu storage musejí umět automaticky sahat po jiných a ve vzájemné souhře pracovat jako jeden celek. Základními pilíři pro nasazení či realizaci takového řešení jsou interoperabilita mezi různými stavebními prvky, transparentnost na dlouhých datových sběrnicích mezi aplikací a fyzickými úložnými zařízeními, stejně jako implementace systémů správy zdrojů pro ukládání dat (Storage Resource Management, SRM). Velký význam připadá také virtualizaci storage, neboť jenom díky ní mohou být odběratelům ukládacích kapacit bez přerušení přidělovány nové storage zdroje na základě stanovených smluv o úrovni služeb (SLA, Service Level Agreement). Správu SAN a zdrojů pro ukládání dat v heterogenních prostředích je dnes možné provádět především díky dohodám o výměně API (Application Programming Interface) mezi výrobci (API swapping). To je ovšem způsob náročný z hlediska času, testování i nákladů.

Politika alokace

Vzhledem k neustálému růstu objemu dat musejí mít administrátoři při ruce účinné pomůcky pro správu úložných kapacit. Právě virtualizace storage představuje takový nástroj, jehož prostřednictvím mohou zákazníkům a jejich obchodním aplikacím poskytnout odpovídající kapacitu, výkon i dostupnost.

Zmíněné úlohy však dnes správci stále ještě ve velké míře provádějí manuálně. Kromě toho je virtualizace pouze jednou ze součástí rozsáhlé problematiky správy systémů pro ukládání dat. Vedle ní je třeba zvládnout množství dalších úkolů -- storage například může být nejprve virtualizována pro server, a jakmile ji detekuje, bude fyzicky zpřístupněna počítačům. V rozsáhlé a komplexní síti pro ukládání dat jsou proto nezbytné další funkce a mechanismy, obzvláště pokud se požadovaný storage prostor nachází v jiné zóně (než servery) a je zabezpečen mechanismy ochrany přístupu. Správce řešení pro ukládání dat dnes navíc musí zvládat také řadu dodatečných administrátorských funkcí. V heterogenním světě, kde s sebou každý systém přináší vlastní možnosti obsluhy a rozsah funkcí je specifický pro určitého výrobce, je téměř nemožné se zcela vyhnout chybám či poruchám.

Tady získávají na významu moderní SRM nástroje, které ohledně podpory systémů pro ukládání dat přesahují kompatibilitu s produkty jediného výrobce a pomáhají integrovat zařízení různých dodavatelů. Zjednodušují tak díky svým pasivním a aktivním funkcím správu storage v heterogenním světě. Hlavním aspektem je zde dohled nad definovanými úrovněmi služeb.

Dohoda mezi provozovatelem IT infrastruktury a jejími interními nebo externími uživateli určuje také dobu, do níž musí být k dispozici nová kapacita po ukládání dat. Kvůli obavám, že nebudou schopny včas reagovat na nedostatek úložných zdrojů, vyhrazují mnohá výpočetní centra pro obchodně kritické aplikace nadbytek kapacity, díky čemuž jsou na ně vázány značně velké nevyužité kapacity a kapitál. Jestliže je však serveru na druhou stranu přiděleno málo prostoru, může se rychle dostat na kritickou hodnotu. Pokud mu pak nebude včas dodatečně přidána dostatečná kapacita, dojde k výpadku aplikace a v návaznosti na to k prostojům i s příslušnými finančními následky.

Nezbytné je také efektivní plánování kapacity pomocí SRM nástrojů, které jsou vedle technických náležitostí schopny vzít v potaz rovněž nákladovou stránku. Dalším důležitým požadavkem je snížení závislosti na lidských zdrojích zajišťujících správu storage infrastruktury, neboť jsou zpravidla neustále nastaveny „na doraz“, přičemž pak podléhají riziku chyb způsobených lidským faktorem a většinou mohou sotva včas reagovat na těsně nastavené parametry SLA. Dlouhodobým cílem proto musí být i vytvoření odpovídajících politik či pravidel řízených procesů, které bude nejen možné automaticky identifikovat, jestliže bude třeba poskytnout další úložný prostor, ale bude dovoleno také jejich autonomní provádění na pozadí. Tato metoda je často popisována pomocí pojmů Storage on Demand nebo Automatic Storage Provisioning.

Sedm důležitých kroků

Koncept automatizace provozu řešení pro ukládání dat se z technického hlediska zakládá na celé řadě předpokladů a funkcí vzájemně provázaných v rámci aktivní správy storage zdrojů. Následující přehled je pouze hrubým shrnutím nejdůležitějších kroků při realizaci či rozšiřování SAN a nemůže si klást nárok na úplnost.

1. Monitoring kapacit: Základem pro inteligentní hledání řešení je korektní změření a určení zabraných nebo volných storage kapacit v absolutních i procentuálních hodnotách. Přitom musejí SRM nástroje analyzovat zdroje podle různých kvalitativních tříd (vysoký výkon, zabezpečení proti výpadku, ceny a dalších) v závislosti na potřebách určitých aplikací, uživatelů či oddělení i na dalších kritériích a neustále hlásit aktuální hodnoty. Navíc budou vyžadovány detailní informace o ukládání až k úrovni souborového systému a aplikací, jinak nelze provádět odpovídající end-to-end management.

2. Správa politik a událostí: Je porovnáván stupeň naplnění logických úložných jednotek, jako souborových systémů či tabulek (table spaces), s definovanými kritickými hodnotami a při jejich vyrovnání je vyvolána odpovídající reakce. Odezvy mohou mít různou podobu -- od jednoduchého uvědomění administrátora až po okamžitý automatický zásah, který proběhne samostatně bez podnětu zvenčí.

3. Detekce volných kapacit s odpovídajícími atributy: Dalším důležitým krokem je lokalizace volných kapacit ve storage síti. Ne všechna zařízení pro ukládání dat jsou však stejná a některá tedy nemusejí splňovat všechny požadavky specifické aplikace. Proto by měla být rozdělena podle svých vlastností, jako jsou vysoká dostupnost, výkon, náklady i jiné parametry figurující v SLA, do různých tříd. Ulehčením práce už v předstihu je vytvoření několika oblastí (poolů), k nimž může administrátor přidělovat nové storage systémy. Takto sestavené pooly zajistí vyšší přehlednost a zjednodušují provádění dalších pracovních kroků.

4. Převod storage do serverové zóny: Pokud se nová storage nachází v zóně serveru, je možné tento krok vynechat. Jestliže ale leží určitý pool nebo nově lokalizovaná jednotka pro ukládání dat mimo oblast přístupnou serveru, a tedy v jiné zóně SAN, musí SRM nástroj zajistit změnu konfigurací v této síti. Přes API rozhraní specifické pro daného výrobce (nebo v budoucnu pomocí SNIA rozhraní SMI-S) bude přizpůsobeno rozčlenění zón (zoning) Fabric Switch přepínačů, jejichž prostřednictvím jsou servery s úložným prostorem fyzicky propojeny.

5. Povolení přístupu serveru k nové storage: Mnohá disková pole využívají v rámci SAN zabezpečovací funkce jako LUN Binding či LUN Masking pro ochranu přístupu. LUN Binding přiděluje přístup na příslušná LUN (Logical Unit Numbers) napevno prostřednictvím určitých Fibre Channel portů úložného systému. LUN Masking kromě toho řídí přes přístupové tabulky s hodnotami World Wide Names (WWN), který server obdrží přístupová práva na daná LUN. Pomocí funkcí LUN Security, jež SRM nástroje nabízejí opět buďto přes API určitého výrobce nebo v budoucnu pomocí SMI-S, musejí být WWN adresy host bus adaptérů v serverech zapsány v přístupových tabulkách (seznamech) úložného systému. Teprve pak získá server oprávnění k přístupu k novým úložným kapacitám LUN, které mají být přiděleny nějaké aplikaci.

6. Alokace a změny velikosti existujících svazků na serveru: S novými LUN, potažmo fyzickými disky v JBOD (Just a Bunch Of Discs) systémech, může aplikace dokázat stále ještě docela málo. Pomocí metody virtualizace bloků musejí být integrovány do existujících logických diskových svazků (logical volume), s nimiž aplikace přímo pracuje. Alokace musí proběhnout bez přerušení -- tedy „on-the-fly“, za běhu, přičemž nesmí vést k žádným výpadkům a prostojům. Nezbytné změny rozložení diskových svazků jsou se ohledem na úroveň RAID pole nebo míru zrcadlení disků rovněž provedeny v on-line režimu. Také by měla hrát rozhodující roli specifikace SNIA.

7. Oznámení dostupnosti vyšší kapacity aplikaci: V posledním kroku je třeba „sdělit“ aplikaci, že od nynějška může pracovat s vyšší úložnou kapacitou. Jako pomůcka slouží k tomuto účelu souběžná změna velikosti souborového systému společně s pod ním ležícím logickým svazkem. Protože je souborový systém standardním rozhraním aplikace pro správu obsazených a volných úložných bloků, bude prostřednictvím současné změny velikosti svazků i souborového systému navýšen podíl použitelných volných bloků pro aplikaci. Efektivní koncept plánování úložné kapacity by měl ovšem sloužit naopak i k tomu, aby bylo možné rozpoznat zřejmé přidělování nadbytečných storage kapacit v průběhu delšího časového intervalu a následně reagovat se zpětnou vazbou na přítomnost nevyužívané storage v úložném poolu.

Utility computing

Nelze pominout skutečnost, že správa storage založená na politikách je na trhu SRM poměrně velmi mladou disciplínou. Teprve málo podniků dnes tento koncept využívá v plném rozsahu. Avšak další růst úložných kapacit a tlak na snižování nákladů dříve či později přinutí IT oddělení zabývat se problematikou řešení Storage on Demand.

Vývoj ovšem nekončí na technické úrovni, ale pokračuje silnější orientací na zohlednění ekonomických aspektů správy IT. Ačkoliv propočty nákladů jako takové nepředstavují technický předpoklad automatického poskytování zdrojů pro ukládání dat, je přece jen smysluplné zabývat se intenzivněji jejich skutečným využitím.  

Storage a příslušné služby bude možné z poolu zdrojů dynamicky vyvolat, měřit i transparentně kontrolovat a vyúčtovat, a to stejně jednoduše a samozřejmě jako vodu z kohoutku nebo elektřinu ze zásuvky. Kritikové proti takovým konceptům namítají, že IT infrastruktura se stane příliš komplexní a komplikovanou, než aby ji bylo možné srovnávat se zmíněnými dennodenně využívanými službami.

Jeden z dobrých důkazů uskutečnitelnosti myšlenky utility computingu, i když v trochu jiné formě, v posledních letech podal internet a jeho využití v privátním sektoru. Zpočátku velmi komplikovaná metoda přenosu dat se pro uživatele postupně stala díky standardizaci hračkou. Uživatelé si individuálně volí poskytovatele, uzavírají s ním smlouvu, v průběhu několika minut jsou sami schopni zprovoznit přístup k internetu a nakonec platí podle smluvního tarifu také například jen za skutečně využitou dobu surfování nebo objem stažených dat.

Centrální pool

Analytická firma Forrester Research v jedné ze svých studií upozorňuje, že většina dotázaných uživatelů by ráda využívala model utility computingu, pokud zajistí efektivnější interní využití IT kapacit a nebude nutně provázán pouze s outsourcingovým modelem. Tímto směrem se v současnosti orientují vývojové trendy výrobců. Protože koncepty utility či on demand computingu nejsou omezeny pouze na oblast ukládání dat, musejí být zavčasu rozpoznána výkonová úzká hrdla v souhře mezi obchodně kritickými aplikacemi, servery, síťovými komponentami a storage. Naskýtá se tedy otázka, zda není nasnadě současně virtualizovat také servery, sdružit je do serverových poolů, nakonfigurovat je podle požadavků operačních systémů nebo aplikací a dynamicky tyto zdroje přidělovat obchodním procesům.

Autor: Frank Bunn, redaktor Computerworldu

Zveřejněno se souhlasem týdeníku Computerworld.

SMI-S jako standard

Pro řešení problémů s interoperabilitou - s cílem vyvinout řešení pro správu heterogenní infrastruktury pro ukládání dat - ohlásila Storage Networking Industry Association (SNIA) 21. srpna 2002 strategickou iniciativu pojmenovanou Storage Management Initiative (SMI).
 
Na základě již existujících standardů WBEM (Web Based Enterprise Management) a CIM (Common Information Model) coby informačním modelu nezávislém na hardwaru a implementaci popisuje SNIA fyzické a logické storage objekty, jejich vzájemné závislosti i funkce pro správu těchto objektů, které přesahují řešení jediného výrobce. Podle modelu sdílených úložných zdrojů SNIA Shared Storage Model budou příslušná rozhraní pro správu fungovat prostřednictvím agentů, kteří komunikují pomocí CIM-XML přes HTTP s řídicími stanicemi, a odesílat stavové a monitorovací informace. Příkazy řídicí aplikace pro aktivní správu storage objektů jsou pomocí agentů překládány na instrukce specifické pro určitého výrobce, určené pro jednotlivá úložná zařízení, a prováděny.
 
V listopadu loňského roku SNAI schválila SMI-S (Storage Management Initiative Specification) ve verzi 1.0.1 jako oficiální specifikaci architektury. Standardní rozhraní popisují vedle pasivních služeb, jako je identifikace a monitoring objektů, také aktivní řídicí funkce, například zoning pro SAN přepínače, správu LUN (Logical Unit Number) v diskových polích nebo virtualizaci storage pro vytváření logických svazků a správu úložných poolů.