Deduplikacja na kilka sposobów

0

Deduplikacja pojawiła się na rynku stosunkowo niedawno. Rozwiązanie w bardzo szybkim tempie zdobywa popularność i jest oferowane przez coraz większa liczbę producentów. Klienci sięgający po deduplikację, przeznaczają mniej środków na systemy storage.

Deduplikacja eliminuje konieczność wielokrotnego zapisu takich samych bloków danych, przez co zmniejsza potrzebę rozbudowy pojemności urządzeń pamięci masowych. Im mniej danych do przechowywania tym lepiej, w ślad za tym idą konkretne oszczędności – mniej kręcących się talerzy w dyskach, niższy pobór prądu, mniejsza ilość wentylatorów i urządzeń chłodzących czy wreszcie mniejsza przestrzeń zajmowana przez system. Oszczędności stanową sumę wymienionych powyżej składników. Dodatkową korzyścią jest mniejsze obciążenie sieci LAN oraz WAN, a także zapotrzebowanie na pasmo od operatora.
Deduplikacja polega na usuwaniu zwielokrotnionych części danych, są one analizowane, dzielone na bloki. Każdy segment jest oznaczany i sprawdzany czy uprzednio nie został zapisany identyczny fragment. Jeżeli dany segment występował już wcześniej, zostaje on zamieniany na znacznik odnoszący się do wcześniej zapisanego ciągu. Jednak zanim firma sięgnie po deduplikację powinna odpowiedzieć na kilka pytań. Czy wszystkie dane należy deduplikować? Czy lepiej deduplikować dane po ich zapisie czy „w locie”? Jakim narzędziem dokonywać deduplikacj

Deduplikacja i dylematy użytkowników

Istnieje kilka sposobów duplikacji danych, proces ten możemy realizować za pomocą opcji w oprogramowaniu do backupu, dedykowanych rozwiązań sprzętowych lub specjalizowanego oprogramowania. Deduplikacja wykonywana przez aplikację do backupu realizowana jest na serwerze backupu lub media serwerze. Cały proces integruje się z backupem, nie ma potrzeby przesyłania danych przez sieć, deduplikacja wykonywana jest w tym samym miejscu co kopia bezpieczeństwa. Tego typu rozwiązania wymagają większej integracji, ale zapewniają dużą elastyczność konfiguracji. Ich wadą jest konieczność stosowania wydajniejszych serwerów, które muszą sobie równocześnie poradzić z procesem backupu i deduplikacji, wykorzystującej moc obliczeniową procesora i pamięci operacyjnej.
Inny sposób to deduplikacja sprzętowa, wykonywana na specjalnie przygotowanych urządzeniach, najczęściej D2D lub VTL. Urządzenia te łączą w sobie zarówno sprzęt, jak i oprogramowanie. To odpowiednia metoda dla użytkowników, którzy chcą aby proces zachodził poza urządzeniem do backupu, np. gdy firma realizuje zdefiniowaną politykę bezpieczeństwa i przesyła dane przez sieć LAN lub WAN do innego urządzenia w celu replikacji. W przypadku tej formy deduplikacji pojawia się pytanie – co wybrać D2D czy VTL? Oczywiście ostatnie słowo należy do administratora. Niemniej jeśli firma posiada dużą ilość taśm i blokową strukturę danych, inwestycja powinna pójść w kierunku VTL. Natomiast w sytuacji gdy przedsiębiorstwo chce odejść od backupu opartego na taśmach, a dodatkowo posiada rozwiązania typu NAS, lepszym wyborem wydaje się być rozwiązanie D2D z deduplikacją.
Kolejna możliwość to specjalizowane, niezależne rozwiązania softwarowe. Oprogramowanie należy zainstalować na wcześniej posiadanym urządzeniu, najczęściej wykorzystuje się w tym celu dedykowany serwer. Wadą takiego rozwiązania jest konieczność integracji oprogramowania z serwerem i storagem różnych producentów. Aczkolwiek przy bardzo małym budżecie można poszukiwać taniego oprogramowania, choć trzeba się liczyć się z faktem wystąpienia trudności konfiguracyjnych i słabszego wsparcia technicznego.

Kolejnym dylematem przed którym staje użytkownik jest wybór momentu dokonywania procesu. Istnieją dwie możliwości, pierwsza pozwala na jego realizację z chwilą wysyłania danych do urządzenia deduplikującego, mówimy wówczas o deduplikacji w czasie rzeczywistym, druga opcja polega na tym, że deduplikacja następuje po wcześniejszym zapisie danych. Tą ostania metodę preferują administratorzy poszukujących rozwiązań skracających czas wykonania backupu. Niestety jest ona kosztowna, bowiem wymaga większej ilości wolnego miejsca do zapisu wszystkich danych. Deduplikacja dokonywana jest po całkowitym backupie danych, a następnie zwalniana jest przestrzeń po nadmiarowych danych. Alternatywą jest deduplikacja w czasie rzeczywistym. W tym przypadku użytkownik nie musi się martwić o dodatkową przestrzeń do backupu. Dodatkowo dane po deduplikacji mogą być natychmiast replikowane na inne urządzenie. Ułatwieniem wyboru może być zakup rozwiązania z opcją przełączania pomiędzy deduplikacją w czasie rzeczywistym lub po backupie.

Obserwując trendy rynkowe, ze względu na wsparcie techniczne i gwarancje jednego producenta oraz łatwość integracji z posiadanymi systemami, wielu administratorów sięga po dedykowane rozwiązania sprzętowe. Ci natomiast, którzy samodzielnie chcą dokonywać konfiguracji i liczą na swoje umiejętności, wybierają opcję w oprogramowaniu, uzyskując większą elastyczność. Jednak bez względu na wybraną wersję, deduplikacja zawsze zmniejsza ilość danych do wykonywania backupu, skracając cały proces. Deduplikacja pomaga również w stworzeniu właściwej strategii odtwarzania danych po awarii. Dzięki niej w miarę łatwo i tanio można dokonywać replikacji danych pomiędzy odległymi lokalizacjami, uzupełniając w ten sposób wykonanie backupu lokalnego.
Analiza korzyści wynikających z zastosowanie deduplikacji nie pozostawia złudzeń, że warto sięgnąć po to narzędzie jak najszybciej. A o wyborze formy i sposobu deduplikacji niech zadecydują administrator bądź dyrektor IT.

Mirosław Chełmecki, Dyrektor Działu Serwerów i Pamięci Masowych, Veracomp SA.

PODZIEL SIĘ

BRAK KOMENTARZY

ZOSTAW ODPOWIEDŹ