Nick Goldman předvádí špetku paměťové DNA

Nick Goldman předvádí špetku paměťové DNA | foto: European Molecular Biology Laboratory

Všechny vaše filmy v necelém gramu. Vědci představili nový typ paměti

  • 84
Vědci předvedli praktický systém, který umožňuje bezpečný a robustní systém zápisu informací do DNA. Zápis je tak hustý, že na záznam všech filmů světa by bylo zapotřebí jen několika desítek gramů tohoto média.

Pokud nechcete mít velkou knihovnu, ale chcete mít hodně knih, pánové Nick Goldman a Ewan Birney našli metodu, která by vaše přání mohla splnit ještě lépe než elektronická čtečka. Připravili vydání Shakespearových sonetů, které vám nezabere prakticky žádné místo. A které také nejspíše velmi snadno ztratíte.

V časopisu Nature britští vědci z ústavu EBI popsali, jak básně slavného Angličana zapsali do DNA, tedy látky, ve které jsou zaznamenány naše geny. Kromě všech Shakespearových sonetů (je jich 154) do ní zakódovali ještě 26 sekund ze známého projevu Martina Luthera Kinga ("Mám sen..."), fotografii svého ústavu, soubor s popisem, jak byla data zakódována, a slavnou práci Jamese Watsona a Francise Cricka o struktuře DNA z roku 1953.

Dohromady to byl necelý megabyte dat ve velmi nenápadném balení, jak se přesvědčili sami autoři. Ti zadali požadavek na výrobu DNA s uloženými informacemi specializované firmě v USA. Ta ji vyrobila, a pak poslala zkumavky běžnou poštou tvůrcům. Těm po dodání trochu zatrnulo, i když věděli, co mají čekat: "Nejdřív jsem si řekl, že udělali chybu, protože zkumavky byly evidentně prázdné," řekl Goldman rádiu NPR. Ale špetka DNA v nich byla, byť okem neviditelná, a v ní byly zapsány všechny informace podle plánu.

Hodně informací na málo gramech

Jistě, posílání vzorků poštou nemůže stačit rychlosti elektronické komunikace. Rychlost však není všechno. DNA má jako paměťové médium jiné výhody.

K čemu je většina DNA?

DNA čili deoxyribonukleová kyselina je nositelka genetické informace všech organismů s výjimkou některých nebuněčných, kterým slouží RNA (např. RNA virům). DNA ve své struktuře kóduje program pro vývoj a vlastnosti celého organismu.

O její existenci víme od roku 1869, a to díky Friedrichu Miescherovi. Od roku 1953 víme také, jak zhruba vypadá. Zdaleka však nevíme vše. Postupně se podařilo zjistit, že věda dokáže vysvětlit funkci jenom několika procent DNA.
A i když jsme se od té doby doby dozvěděli mnohé, v kardinální otázce "K čemu je většina DNA?" vlastně není jasno dodnes, jak jsme na Technetu psali nedávno.

Nabízí například více "muziky" v menším objemu: je dnes médiem s největší hustotou záznamu vůbec. Do jednoho gramu DNA se dá podle autorů zapsat zhruba 2,2 petabytů (předpona "peta-" znamená 1015, tedy milion miliard). Hustota záznamu současných pevných disků je zhruba stotisíckrát menší.

V případech skladování velkého množství dat by mohla být úspora dramatická. Třeba středisko CERN dnes skladuje zhruba 80 petabytů s údaji ze svých pokusů. Používá k tomu stovku páskových jednotek. Stejné množství údajů by se přitom dalo vepsat do necelých 40 gramů DNA.

Ale to není vše. CERN používá magnetické pásky, protože jsou levné a také trvanlivé. Ale to je DNA také. Od doby dinosaurů nám sice žádná nevydržela (bílkoviny zřejmě ano), ale za příhodných podmínek (třeba v zubech zvířat či lidí) může vydržet až desítky tisíc let. Dokazuje to třeba přečtení genomu neandrtálců. Za vhodných podmínek se DNA tedy rozpadá tak pomalu, že by neměl být problém ji za vhodných podmínek skladovat desítky až stovky let bez ztráty informací, domnívají se vědci.

Krok správným směrem

Budova European Bioinformatics Institute v Nixtonu, kde pracují autoři výzkumu. Jde o fotografii, která byla zakódvana v DNA (JPEG s rozlišením 640 na 480 pixelů).

"Je to důležitý krok. Nový obor se etabloval," komentoval zprávu o nové práci pro časopis Nature George Church z Harvard Medical School. Jeho názor je zajímavý, protože Church s kolegy v loňském roce zakódoval do DNA svou knihu o biologii (studie vyšla v časopise Science).

Rozdíl mezi oběma pracemi ilustruje, jak rychle se obor může rozvíjet. Church s kolegy byli průkopníci. Například struktura jejich záznamu byla poměrně jednoduchá. DNA tvoří řada čtyř různě se střídajících sloučenin (bází), které se označují písmeny A (adenin), C (cytosin), G (guanin) a T (thymin). Tým si řekl, že A a C budou označovat nuly a G a T jedničky v binárním kódu, a ty pak zapisovali do bloků (po 19 písmenech) za sebou.

Goldman s kolegy v nové práci použili podstatně lepší systém. Údaje zapisují do bloků s přesnou strukturou, takže lze snadno zjistit, jestli jsou data narušená . Navíc se oddíly vzájemně překrývají, takže pokud se některý poruší, údaje jde obvykle zachránit z jiného bloku (redundance je čtyřnásobná).

Použitá metoda také umožňuje lepší indexování: tedy informace, kolik dat vlastně celý zápis obsahuje a jak (aby bylo například jasné, jestli někde kus nevypadl). Opatření výrazně snižují množství informací, které se dá do DNA zapsat (maximální teoretický limit je 455 × 1018 bytů na gram, tedy stomilionkrát vyšší vyšší než dosažená hodnota), ale za spolehlivost to patrně stojí.

Živá paměť?

Nejen Goldman a spol. se zabývali otázkou, jestli by se možností DNA ke skladování informací nemohlo nejlépe využít vytvořením organismu, který by zároveň sloužil jako médium, (máme na mysli paměťové médium).

Mohlo by jít třeba o bakterii, která by ve své DNA nesla nějakou zakódovanou informaci. Na pohled by to mohlo být výhodné: třeba už proto, že množením jejího nositele by se uložené informace mohly automaticky "zálohovat" a obnovovat.

Bohužel, život dělá chyby. I při přepisu DNA vznikají čas od času omyly, které vedou ke změně genetického kódu (a tím mutacím). Organismům většinou podle všeho nevadí, ale informaci by mohly časem znehodnotit.

Proto se vědci domnívají, že výhledově bude "mrtvá" DNA pro skladování informací lepší. Ale v tuto chvíli se mají chemici od přírody ještě co učit: lidská technologie má chybovost asi 1:500, zatímco třeba lidské buňky dělají chyby v jednom z cca sta tisíc případů. A mají opravné mechanismy, které tento poměr ještě sníží.

Systém zápisu je mnohem robustnější a lze si představit jeho využití v praxi. Byť na skladování opravdu velkého množství dat bude asi nutné ještě (a poměrně výrazně) snížit chybovost záznamu.

Kolik to stojí?

Existují i další méně či více zjevné nevýhody. První je neměnnost zápisu. Změna v něm je možná pouze změnou chemického složení média, což znamená rozbití řetězce DNA, náhradu stávající báze za jinou a pak znovu spojení řetězce. V praxi je to ještě složitější, než se zdá, takže technologie bude asi vždy použitelná jen k dlouhodobé archivaci dat.

Ke slovu přijdou i peníze. Syntéza DNA je náročná chemie a vytvoření kousku s jedním megabytem informací by dnes v komerčních cenách vyšla na něco přes 12 tisíc dolarů (zhruba 230 tisíc korun), odhadují autoři nové studie. O tak drahé technologii byste při dnešních cenách mohli uvažovat pouze v případě, kdybyste měli udělat archiv řádově na stovky či tisíce let. Za tu dobu byste totiž jiná média museli přepisovat tolikrát, že by se vyplatilo i velmi drahé vytváření DNA na zakázku. Ale mimo tento hypotetický příklad nemá technologie šanci dnešním metodám konkurovat.

Navíc by bylo nutné za přístup do archivu vybírat vysoké poplatky. I dekódování, tedy "čtení" DNA je dnes drahá záležitost. Přečtení jedné knihy by vás rozhodně vyšlo na stovky či tisíce korun. Přečtení 1 MB totiž stojí podle odhadu autorů dnes 220 dolarů, tedy přes 4 000 korun. 

Útěchou snad může být, že ceny této technologie velmi rychle klesají. Před 20 lety stál projekt čtení lidského genomu necelé tři miliardy dolarů (cca 60 miliard korun), dnes dokážeme totéž za jednotky tisíc dolarů (desítky tisíc korun). A technologický pokrok v této oblasti se zatím nezastavil.

Paměť z DNA ve svém osobním počítači nejspíše jen tak mít nebudete, na to jsou a (zřejmě velmi, velmi dlouho budou) zápis a čtení do DNA příliš pomalé. Ale není vůbec vyloučeno, že si do DNA jednou nebudete "vypalovat" data, o která nechcete nikdy přijít, třeba fotografie či videa (hologramy?) prvních krůčků svých dětí či vnoučat. Suché, chladné a temné místo, kam si těch pár miligramů cenných vzpomínek můžete schovat, se najde snadno.