DNA ako trvalé a efektívne biologické úložisko digitálnych údajov 169; Assmannova nadácia
Správy z vedy
DNA ako dlhotrvajúce a efektívne biologické úložné médium pre digitálne údaje [169]
Koncept personalizovanej medicíny sľubuje, že každému pacientovi bude čo najviac prispôsobené odporúčania týkajúce sa prevencie a liečby chorôb (1). Aby to bolo úspešné, je potrebné najskôr zhromaždiť, vyhodnotiť a predovšetkým uložiť veľké množstvo údajov.

Bežné médiá na ukladanie údajov, ako napríklad pevné disky, majú relatívne malú životnosť. Z dôvodu uchovania týchto údajov je potrebné ich pravidelne kopírovať. Dvaja vedci z Kolumbijskej univerzity a New York Genome Center (NYGC) teraz využívajú potenciál DNA materiálu ako biologického úložiska digitálnych informácií (2). Pomocou algoritmu určeného na streamovanie videa z mobilného telefónu sa im podarilo skomprimovať kompletný operačný systém počítača, film a ďalšie súbory v DNA oligonukleotidoch a načítať ich neporušené.
Vedecké podrobnosti
Genetické nosiče sú takmer dokonalým úložným médiom. DNA prijíma informácie extrémne komprimované počas tisícročí a technicky nestarne.
Profesor počítačovej vedy Yaniv Erlich z Columbia’s Data Science Institute a jeho kolegyňa Dina Zielinski teraz v spolupráci s New York Genome Center dokázali, že DNA je vhodná aj na zachovanie neporušených digitálnych údajov. Vybrali šesť reprezentatívnych súborov na kódovanie do DNA; kompletný operačný systém pre počítač, francúzsky krátky film Príchod vlaku do La Ciotatu z roku 1895, darčeková karta Amazon v hodnote 50 dolárov, počítačový vírus, priekopnícky odznak a publikácia z roku 1948 od teoretika informácií Clauda Shannona.
V kombinácii s hlavným súborom bolo šesť médií preložených do krátkych reťazcov binárneho kódu zložených z jedničiek a núl. Algoritmus korekcie Fontovho kódu pomohol náhodne priradiť tieto reťazce k štyrom nukleotidovým bázam v DNA: A, G, C a T a vymazať kombinácie chýb. Výsledné informačné kvapôčky dostali na dešifrovanie čiarové kódy.
Spustenie syntézy DNA, spoločnosť Twist Bioscience zo San Franciska, previedlo 72 000 takto opísaných reťazcov DNA na molekuly DNA. V neposlednom rade je možné digitálne informácie z týchto biomolekúl získať bez chýb. Pomocou techniky kódovania sa vedcom podarilo duplikovať reťazce DNA a vytvoriť tak bezchybné kópie pôvodných súborov.
Pozoruhodný bol aj kompresný výkon. Do každého nukleotidu bázy bolo zabalených priemerne 1,6 bitu, čo je najmenej o 60% viac údajov ako pri bežných technikách. Na uloženie 215 petabytov dát (= 1 000 000 000 000 bajtov) stačí jediný gram materiálu DNA. Biomolekuly sa preto považujú za najhustejšie zariadenie na ukladanie údajov, aké sa kedy použilo. Archivácia digitálnych údajov v biologickom úložisku je stále príliš nákladná na použitie vo veľkom. Výroba reťazcov DNA si vyžiadala 7 000 dolárov a ďalších 2 000 dolárov na ich dešifrovanie.