Backup dysk-dysk całkiem wyprze taśmy?

0

Zastosowanie twardych dysków jako uzupełnienie lub zastępstwo taśm w rozwiązaniach backupu stało się bardzo popularne w ciągu ostatniej dekady. Nie odbywa się to jednak bez wpływu (technicznego, biznesowego i finansowego) na procesy ochrony danych firm przed skutkami awarii. Stworzenie optymalnej architektury podczas integracji systemów dyskowych w procedurze backupu możliwe jest tylko wtedy, gdy szczegółowo poznamy wiążące się z tym procesem konsekwencje.

Backup, odzyskiwanie danych z backupu, archiwizacja i replikacja to całkowicie różne procesy. Często błędnie nazwy tych procesów są używane zamiennie, ale na początku trzeba podkreślić, że w systemie pamięci masowych pełnią one zupełnie różne role. Istnieje wiele metod podejścia do ochrony danych, a wybór właściwej zależy od potrzeb biznesowych. Aby wybrać właściwą metodę, administratorzy powinni zadać sobie kilka pytań:

  • Po co wykonuję backupy? Czy będę przechowywać kopie zapasowe przez długi czas, czy też potrzebuję mieć dostęp do danych utraconych przed chwilą?
  • Czy muszę systematycznie wykonywać kopie danych, które nie zmieniają się często lub nie następuje ich częsty odczyt?
  • Czy w swoim podstawowym systemie storage mam dane, które mogłyby być zarchiwizowane?

Ochrona danych jest związana z wykonywaniem jednej lub więcej kopii danych. Aby spełnić wymogi planów ochrony przed skutkami katastrofy (disaster recovery), kopia danych powinna być przechowywana poza siedzibą firmy. Z reguły też do takiej kopii danych nie jest potrzebny natychmiastowy dostęp. Katastrofy występują bardzo rzadko i są tylko ułamkiem wśród zapotrzebowania na dostęp do kopii danych

Najczęściej zapotrzebowanie na odzyskanie danych z backupu związane jest z czynnikami niekatastroficznymi, takimi jak ludzki błąd czy inna przypadkowa utrata danych. W takim przypadku najbardziej przydatna będzie przechowywana lokalnie kopia danych. Dzięki właściwościom twardych dysków, a przede wszystkim szybkiemu dostępowi do przechowywanych danych, odzyskanie danych z udostępnionych serwerowi lub w sieci twardych dysków jest znacznie szybsze niż z taśmy.

Systemy przechowywania i ochrony danych są opisywane przez dwa główna parametry czasowe:
Recovery Time Objective (RTO) oraz Recovery Point Objective (RPO). RTO to ilość czasu potrzebnego na odzyskanie danych. RPO to punkt w przeszłości, z którego będziemy odzyskiwać dane.

Aby spełnić wymagania planu DR i zapewnić krótkie czasy RTO i RPO (a tym samym wysoki poziom usług), działy IT zwykle przechowują część danych wewnątrz firmy, a część poza jej siedzibą. Najczęściej im krótszy jest czas RTO i RPO, tym więcej kosztuje dane rozwiązanie. Najszybsze (ale i najdroższe) obecnie rozwiązanie, gwarantujące czasy RTO i RPO poniżej jednej sekundy, to synchroniczna replikacja dyskowa. Na drugim końcu osi jest backup na taśmę, gdzie nośniki są przechowywane poza siedzibą firmy. To jest relatywnie najtańsza opcja, ale z najdłuższymi czasami RTO i RPO.

Są cztery główne przyczyny zmuszające do uzyskania dostępu do kopii bezpieczeństwa:

  • Odzyskanie danych po lokalnej utracie danych, gdzie krytyczne są krótkie czasy RPO i RTO. Ten scenariusz jest najbardziej popularny i to głównie w tych rozwiązaniach są wykorzystywane rozwiązania backupu dysk-dysk.
  • Wydobywanie danych na potrzeby procesów sądowych oraz żeby zapewnić zgodność z przepisami wewnętrznymi firmy, prawem itp. To dość rzadki przypadek, ale ze względu na konieczność szybkiego przeszukania dużej ilości danych, do udostępniania kopii stosowane są systemy z twardymi dyskami.
  • Dostęp do starych danych. Potrzeba ta występuje dość rzadko i jeśli musimy archiwizować dużą ilość danych, polecane są systemy taśmowe.
  • Odzyskanie danych po katastrofie, gdy im krótsze czasy RPO i RTO, tym lepiej. To bardzo rzadki przypadek, wykorzystujący systemy backupu danych na taśmę wywożoną z siedziby firmy.

Backup na taśmę

Kopiowanie danych na taśmę było stosowane jako metoda backupu przez wiele dekad, ale skracające się czasy RTO i RPO spowodowały, że zarządzanie kopiami bezpieczeństwa znajdującymi się na taśmach stało się bardzo skomplikowane. Przy dzisiejszych wymaganiach odzyskiwanie danych z taśm jest nieefektywne – przede wszystkim zabiera zbyt dużo czasu i jest narażone na dodatkowe błędy ludzkie.

Biorąc pod uwagę funkcjonalność i spadające ceny oferowanych dziś rozwiązań dyskowych wykorzystanie taśm ograniczyło się tylko do archiwizacji, gdzie dane odczytywane są wyjątkowo rzadko. Niektóre firmy jednak wciąż wykorzystują systemy backupu taśmowego ze względu na bardzo niski koszt nośników i zarządzania nimi (taśmy leżące na półce nie pobierają prądu) oraz możliwość wywiezienia nośnika z siedziby firmy.

Zapomniane archiwum

Zanim przystąpimy do projektowania systemu backupu z wykorzystaniem dysków, warto jest uważnie przyjrzeć się w jaki sposób firma archiwizuje dane. Już od samego początku koncepcja archiwizacji była związana z koncepcją backupu i często z nią mylona. Podstawową różnicą jest to, że przy przenoszeniu danych do archiwum są one kasowane ze źródłowego systemu, natomiast podczas wykonywania backupu dane są tylko kopiowane.

Do tej pory niewiele firm prowadzi cyfrowe archiwum, jako że koszt zarządzania nim może być większy niż koszt przechowywania tych danych w podstawowym systemie pamięci masowych. W ten sposób nawet najrzadziej wykorzystywane dane wciąż są zapisywane w podstawowych systemach pamięci masowych, a tym samym podlegają regularnemu backupowi. Natomiast ostatnie badania pokazują, że ponad 80% danych starszych niż miesiąc nie jest nigdy odczytywanych. Poddanie ich archiwizacji zarówno odciąży macierze dyskowe w firmie, jak też przyspieszy proces wykonywania backupu.

Backup na dysk

Macierze dyskowe oferują o wiele większą wydajność i niezawodność niż biblioteki taśmowe. Dotyczy to zarówno zwykłych macierzy dyskowych, jak i wirtualnych bibliotek taśmowych (VTL). Kolejną korzyścią z wykorzystania pamięci dyskowych jako nośnika backupu jest możliwość śledzenia zmian w systemach plików i tworzenia tylko kopii różnicowych. Funkcja ta była możliwa także przy taśmach, ale wówczas odzyskanie konkretnego pliku we wskazanej wersji zajmowało czasem nawet kilkanaście godzin. Oczywiście systemy backupu dyskowego nie są pozbawione wad. Oto główne z nich:

  • wysoki koszt przechowania 1 GB danych w porównaniu z systemami taśmowymi,
  • większy pobór prądu,
  • konieczność zmiany procedur w planach DR,
  • wysoki koszt związany z replikacja danych do zdalnego ośrodka.

Backup D2D kontra VTL

Pierwotnie koncepcja realizacji backupu dysk-dysk była związana z wirtualnymi bibliotekami taśmowymi, gdzie jako nośnik wykorzystywane są dyski, ale cały system widziany jest przez serwery jako biblioteka taśmowa. Dzięki temu możliwe było szybkie i łatwe zintegrowanie wirtualnych bibliotek taśmowych z już funkcjonującym w firmie środowiskiem, natomiast wiele cech twardych dysków było przyćmionych poprzez ukrycie ich za interfejsem taśmowym.

Wykorzystanie systemów backupu dyskowego nie oznacza, że taśmy są w nim całkowicie zbędne. Wciąż odgrywają one ważną rolę w całościowej strategii ochrony danych. Najczęściej wykorzystywane są jako nośnik do wykonania drugiej kopii bezpieczeństwa z dysku, na który już wcześniej wykonano backup (dysk-dysk-taśma, D2D2T) – szczególnie tam, gdzie plan DR wymaga przechowywania kopii danych poza siedzibą firmy. Niekorzystną sytuacją podczas realizowania scenariusza D2D lub D2D2T jest fakt, że aplikacje umożliwiające wykonywanie backupu przygotowują dane do zapisania na dysk w inny sposób niż miało to miejsce w przypadku taśm. Co prawda wszyscy producenci oprogramowania do backupu wprowadzili już możliwość backupu na dysk, ale niektórzy wymagają kupna dodatkowej licencji do uruchomienia tej funkcji. Co więcej, wiele procedur, do tej pory zautomatyzowanych, musi być przejrzanych i zrewidowanych. Niesie to ze sobą dodatkowe koszty operacyjne.

Firmy, które mają niewielką ilość danych, a potrzebują szybkości i niezawodności dysku przy jednoczesnej możliwości wywiezienia nośnika, powinny rozważyć kupno systemu RDX. Jego funkcjonalność jest podobna do napędów taśmowych – nośnikiem są tu małe twarde dyski zainstalowane w kasetach, które są umieszczane w podłączonym do komputera urządzeniu odczytująco-zapisującym. Dostęp do danych jest znacznie szybszy niż w przypadku taśm, a jednocześnie taki wymienny nośnik można wywieźć z firmy.

Przyszłość backupu D2D

W działach IT małych i średnich firm, gdzie nie jest konieczna integracja systemu backupu dyskowego z istniejącymi rozwiązaniami taśmowymi, z pewnością wygrają systemy D2D. Wirtualne biblioteki taśmowe będą wykorzystywane głównie w dużych firmach ze względu na konieczność integracji z systemami backupu taśmowego i ograniczoną możliwość ingerencji w procedury ochrony danych (ma to miejsce szczególnie w środowiskach komputerów mainframe).

Ze względu na coraz większy rozwój technologii replikacji, deduplikacji i kopii przyrostowych, systemy backupu dyskowego będą znajdować coraz więcej nabywców. Będzie też można zaobserwować proces integracji kilku produktów w jeden, np. umieszczania napędów RDX w macierzach dyskowych, dzięki czemu stanie się możliwe realizowanie backupu dyskowego i szybkiego wywiezienia kopii danych z firmy.

PODZIEL SIĘ

BRAK KOMENTARZY

ZOSTAW ODPOWIEDŹ