Deduplikácia je diéta pre úložné zdroje
- Nasleduj nás
- Spravodaj
- kremíková aplikácia
- Kanály RSS
- Kiosk Google Play
- Informačné vestníky
- Prihlásiť sa
Starý príbeh znie: Namiesto nariekania nad narastajúcim objemom údajov by bolo pekné, keby sa dali zredukovať na to najnutnejšie. Deduplikácia to dokáže.

Je to ako s diétou. Kilá by mali ísť dole, hmota musí ísť. Úspešná diéta na chudnutie sa vyznačuje pridaním dôležitých a nadbytočných zložiek stravy. Čo telo potrebuje, to dostane, ale nič viac. Jedine tak sa dá schudnúť a výsledkom je menšia sýtosť. V dátovom centre to v zásade nie je inak. Explodujúca masa dát z rôznych zdrojov spôsobuje zväčšenie úložnej oblasti. Každý deň sa pridáva nové jedlo vo forme bitov a bajtov. V časoch menších rozpočtov nemusí správca najskôr myslieť na väčšie kapacity, ale na efektívnejšie metódy ukladania.
Veľké množstvo informácií tiež zdôrazňuje zálohu. Časové rámce na denné alebo dokonca hodinové zálohovanie údajov sú malé a do bezpečných oblastí by sa malo stále viac a viac informácií dostávať. To sa dá ťažko zosúladiť. V ďalšom kroku si správca pamätá aj archív, ktorý neúprosne nafukuje a mohol využiť aj zníženie záplavy dát.
Takže to, čo sa musí stať, je nakoniec veľmi jednoduché - teoreticky: Ak nie je možné znížiť množstvo dát vo výrobe, musí sa znížiť aspoň počet záloh a archívov. Používateľov aj aplikácie by bolo možné prinútiť, aby produkovali menej dát. Nie je potrebné o tom ďalej hovoriť, nefunguje to, najmä preto, že spoločnosti z dôvodu efektívnosti čoraz viac vybavujú obchodné procesy digitálne. Už nejaký čas, naposledy prevzatím špecialistu „Dedupe“ Avamara spoločnosťou EMC, poskytla aspoň jedna metóda uvoľnenie: deduplikácia.
Cez trhliny padajú nadbytočné údaje
Zjednodušene povedané, deduplikácia je technológia, ktorá nikdy neukladá údaje dvakrát. Metóda porovnáva množinu údajov, súbory alebo bloky údajov, ktoré sa majú uložiť, s informáciami, ktoré sú už uložené. Ak sú identifikované nadbytočné súbory alebo dátové bloky, riešenie Dedupe poskytuje novo prijatému údajovému záznamu takzvané referenčné ukazovatele v mieste duplikácie. Odvolávajú sa na už uloženú sekvenciu a zaberajú menej miesta ako pôvodné údaje. Novo pridaná množina údajov je preto menšia, pretože je potrebné znova uložiť menej informácií.
Príklad: Bez deduplikácie by sa nasledujúca pieseň musela ukladať znova a znova pre každý verš:
Na stene, na vyhliadke, sedí malý chrobák.
Zoznámte sa s chrobákom, ako môže chrobák tancovať.
Na stene, na vyhliadke, sedí malý chrobák.
Ako je známe, speváčka pri každom verši vynecháva list so slovami „Wanze“ a „Tanz“, teda Wanz ‘, Wan‘, tanec ‘,‚ tan ‘a tak ďalej. Pri deduplikácii je hlavná časť skladby už uložená, pridávajú sa iba nové, zmenené výrazy. Ak aplikácia alebo používateľ požaduje konkrétny súbor údajov, najskôr ho príslušný softvér znova zostaví a doručí ako kompletný súbor.
To znie trochu ako kompresia dát. Porovnanie je povolené, ale kompresné techniky nemôžu držať krok s deduplikáciou. Vo väčšine prípadov je kompresný pomer 2: 1, čo znamená, že databázu je možné zmenšiť zhruba na polovicu. Adic - výrobcu prevzala spoločnosť Quantum - hovorí, že s deduplikáciou je k dispozícii až 40-krát viac úložného priestoru na zálohovanie disku. "Predtým ste na disk mohli vložiť iba údaje z niekoľkých dní." Teraz sa do toho zmestili mesiace, “uviedol Steve Mackey, riaditeľ produktového marketingu EMEA v spoločnosti Quantum počas predstavenia produktovej rady Dedupe Dxi-Series. Avamar hovorí dokonca o znížení v pomere 300: 1. Podľa výrobcu je výpočet založený na množstve dát, ktoré sa denne ukladajú ako „plná záloha“.
Duplikujte pri zdroji alebo na mieste určenia?
Mnoho výrobcov, viac prístupov. Názory na to, čo je deduplikácia, sa raz nelíšia. Tam, kde by mal proces prebehnúť, majú však výrobcovia rôznych prístupov svoje vlastné argumenty, ktoré je potrebné stmeliť.