Rewolucja w świecie serwerów wywołana przez wirtualizację wpłynęła również na metody tworzenia kopii zapasowych. Tradycyjne narzędzia do backupu przestały się sprawdzać, ale na rynku są już dostępne rozwiązania, które umożliwiają efektywne zabezpieczanie środowisk wirtualnych.
Wirtualizacja serwerów to już praktycznie standard. Według szacunków IDC pod koniec 2012 r. na ponad 50 % serwerów fizycznych działało oprogramowanie wirtualizacyjne. Korzysta z niego większość firm, a liczba wirtualnych maszyn już kilka lat temu przekroczyła liczbę serwerów fizycznych. Ta technologia odmieniła środowisko centrów obliczeniowych, co pociągnęło za sobą również konieczność zmian w podejściu do backupu. Wynika to z istotnych różnic pomiędzy tradycyjnym i wirtualnym środowiskiem serwerowym. Okazuje się jednak, że firmy, szczególnie z sektora MSP, nie dostrzegają wpływu, jaki wirtualizacji ma na tworzenie backupu i odzyskiwanie z nich danych.
Specyfika środowiska wirtualnego
Wraz z popularyzacją wirtualizacji serwerów zaczęto dostrzegać szereg problemów z tworzeniem backupu w tym środowisku. Weźmy chociażby pod uwagę fakt, że wirtualizacja daje możliwość wykorzystania w znacznie wyższym stopniu mocy obliczeniowej serwerów. Dobre praktyki sugerują, żeby trzymać się poziomu 50-60 %, podczas gdy w tradycyjnym środowisku utylizacja wynosiła przeciętnie ok. 10 %. To oznacza, że w środowisku wirtualnym dla agentów systemu backupowego zostaje znacznie mniej wolnych zasobów. Tymczasem agent potrzebuje sporej mocy obliczeniowej, żeby ustalić, które pliki i bloki należy skopiować, a następnie skompresować je przed transmisją.
Kolejna istotna różnica to dyski wirtualnych maszyn, które w istocie są pojedynczymi plikami emulującymi twarde dyski. Jeśli ktoś zdecyduje się na tworzenie ich kopii, musi liczyć się z tym, że za każdym razem będzie kopiowany cały plik wirtualnego dysku, mogący liczyć wiele gigabajtów. Bez znajomości wewnętrznej struktury wirtualnego dysku nawet drobna zmiana powoduje konieczność skopiowania w całości ogromnego pliku. Jest to wyjątkowo nieefektywne. Poza tym istnieje ryzyko, że backup tworzony dla pracującej maszyny wirtualnej będzie nie spójny.
Wyzwaniem jest również łatwość dodawania nowych maszyn wirtualnych. W środowisku fizycznym pojawienie się nowego serwera było „dużym” wydarzeniem. Natomiast tworzenie nowej maszyny wirtualnej jest bardzo proste i szybkie, ale na samym procesie konfiguracji nie można poprzestać. Należy jeszcze pamiętać, żeby objąć ją ochroną backupową, w przeciwnym razie istnieje ryzyko utraty danych. Bez integracji między systemem backupu a platformą wirtualizacyjną wykrycie faktu utworzenia nowej wirtualki jest trudne. Z reguły administrator musi pamiętać o zainstalowaniu agenta backupu, albo mieć narzędzie, którego będzie ręcznie używał do wykrycia nowej maszyny wirtualnej.
Charakterystyczną cechą środowisk wirtualnych jest migracja maszyn między serwerami fizycznymi. Ten czynnik może doprowadzić do sytuacji, w której dany system nie będzie objęty backupem. Kłopoty mogą pojawić się również przy odzyskiwaniu, szczególne jeśli ma to nastąpić szybko. Bez możliwości wglądu w pliki wirtualnych dysków trzeba przywrócić całą maszynę wirtualną, a następnie ją uruchomić lub podpiąć dany dysk do innej maszyny, żeby móc uzyskać dostęp do jego zawartości, np. pojedynczego pliku. Istotne są również kwestie finansowe, czyli dostosowanie modelu licencjonowania do specyfiki środowiska wirtualnego.
Tradycyjny backup zawodzi
Rozwiązania do backupu, które znamy ze środowiska fizycznego, można również stosować w środowisku wirtualnym. Rodzi to jednak szereg problemów z uwagi na opisane powyżej różnice. Najpoważniejszy to konieczność instalowania agentów backupu. W każdej maszynie wirtualnej można zainstalować takiego agenta, jednak przy dużym zagęszczeniu maszyn wirtualnych na jednym serwerze fizycznym może to doprowadzić do wykorzystania sporej części dostępnych zasobów i przełożyć się na spadek wydajności działania aplikacji produkcyjnych. Znacznie komplikują się również zadania osoby odpowiedzialnej za konfigurację backupów, ponieważ musi one wiedzieć, jakie maszyny wirtualne działają na danym serwerze, żeby nie ustawić dla nich kilku backupów w tym samym czasie. Co więcej, agent nie rozróżnia czy działa na serwerze fizycznym czy w maszynie wirtualnej. Nie jest również świadomy migracji maszyn wirtualnych pomiędzy serwerami.
Te problemy, w szczególności architektura wykorzystująca agentów, sprawiają, że tradycyjne systemy backupu nie są najlepszym rozwiązaniem do ochrony środowisk wirtualnych. Mimo to wielu administratorów z przyzwyczajenia wciąż je stosuje. Jednak konieczność zastosowania nowego podejścia do kopii zapasowych, które polega na ścisłej integracji systemu backupu z hypervisorem i warstwą zarządzającą środowiskiem wirtualnym, jest oczywista. Dobra wiadomość jest taka, że na rynku są już produkty, które adresują wyzwania backupu stwarzane przez wirtualizację serwerów.
Nowoczesny backup maszyn wirtualnych
W ostatnich latach metody backupu środowisk wirtualnych szybko się rozwijały. Początkowo stosowano tradycyjne sposoby tworzenia kopii zapasowych, jednak to generowało szereg opisanych wyżej problemów. Pierwszym rozwiązaniem był backup tworzony na poziomie dysków wirtualnych maszyn. Tym sposobem wyeliminowano agentów i obciążenie procesora przez nich generowane. Niestety to podejście nie dawało wglądu w zawartości maszyny wirtualnej, w efekcie kopiowane były wszystkie dane, także skasowane pliki i wolna przestrzeń.
Z tą kwestią producenci również sobie poradzili, wprowadzając aplikacje wyposażone w mechanizmy ograniczające ilość kopiowanych danych, a także w wiele innych przydatnych funkcji, jak deduplikacja, rozpoznawanie wolnej przestrzeni czy śledzenie zmian na poziomie bloków. Ponadto niektórzy producenci oferują już funkcje pozwalające na odzyskiwanie wybranych elementów z wirtualnego dysku, np. pojedynczych plików czy wiadomości e-mail. Jednak najwięksi dostawcy na tym rynku wolno reagują na gwałtowny wzrost popularności wirtualizacji. W miedzy czasie wyrosła im groźna konkurencja, oferująca produkty do backupu stworzone od podstaw z myślą o środowiskach wirtualnych, które ściśle integrują się z hypervisorami.
Kopie zapasowe według Veeam
Jedną z takich aplikacji jest Veeam Backup & Replication, działająca w środowisku VMware oraz Hyper-V. Najważniejszą jej cechą jest bezpośrednia komunikacja z infrastrukturą wirtualną. Dzięki temu narzędzie ma dostęp do informacji o maszynach wirtualnych i serwerach fizycznych, na których one działają. Potrafi również tworzyć migawki (snapshot) bez wstrzymywania pracy wirtualek, a także kopiować tylko zmienione bloki, co diametralnie skraca czas backupu i ilość danych do skopiowania. Te właściwości umożliwiły zaprogramowanie zaawansowanych funkcji, jak tworzenie wirtualnego labu do testowania backupów czy szybkie przywracanie maszyn wirtualnych, które uległy awarii.
Aplikacja Veeam działa bezagentowo w każdym scenariuszu tworzenie kopii zapasowych oraz przywracania danych. Bez użycia agenta umożliwia tworzenie dowolnego rodzaju kopii, np. danych specyficznych dla aplikacji. Również proces odzyskiwania odbywa się bezagentowo, niezależnie czy chodzi o przywrócenie całej maszyny wirtualnej czy jedynie pojedynczych plików lub elementów aplikacji. Veeam Backup & Replication komunikuje się z vCenter bądź SCVMM, ale także bezpośrednio z hostami (w środowiskach, gdzie nie ma vCenter lub SCVMM), skąd pobiera nazwy i lokalizacje wirtualnych dysków, a następnie tworzy ich kopie zapasowe.
Rys. Lista zadań backupu
Aplikacja potrafi zapisywać kopie zapasowe w różnych miejscach i różnymi sposobami: lokalnie na dysk (bardzo krótki czas przywracania), migawki z wykorzystaniem macierzy (umożliwiają bardzo częste tworzenie punktów przywracania), replikację do zdalnej lokalizacji (zawarta w cenie standardowej licencji) oraz na taśmach lub w chmurze (w celu długoterminowego przechowywania). To pozwala chronić dane na różne sposoby oraz przywracać je najszybciej, jak to możliwe (funkcja Instant Recovery błyskawicznie przywraca maszynę wirtualną z jej kopii zapasowej). Zaletą takiego podejścia jest również możliwość korzystania z funkcji automatycznego weryfikowania, czy utworzona kopia umożliwia odtworzenie. W przypadku wykrycia problemów administrator otrzymuje powiadomienie.
Punkty przywracania mogą być tworzone bardzo często, co jest szczególnie przydatne w przypadku restrykcyjnych wymagań odnośnie parametru RPO (Recovery Point Objective, – określa interwał, co który tworzona jest kopia zapasowa i jednocześnie jest to maksymalna tolerancja utraty danych, na jaką organizacja może sobie pozwolić bez odczuwalnych strat). Kopie mogą być tworzone praktycznie z dowolną częstotliwością.
Zaletą Veeam Backup & Replication jest nie tylko szybki czas przywracania maszyn wirtualnych z kopii zapasowych. Nie mniej ważna jest możliwość wglądu w backup i wyciągnięcia z niego jedynie potrzebnych elementów: pojedynczych plików, elementów witryn Microsoft SharePoint czy wiadomości e-mail z baz Microsoft Exchange.
Rys. Veeam Explorer for SharePoint umożliwia odzyskiwanie pojedynczych elementów witryn
Również model licencjonowania jest dostosowany do środowiska wirtualnego. Użytkownik nie płaci za każdą chronioną maszynę wirtualną, lecz wykupuje licencje w przeliczeniu na liczbę rdzeni procesorów. Przykładowo, dla serwera z dwoma czterordzeniowymi procesorami należy wykupić dwie licencje.
Mniej danych, więcej pieniędzy
Aby zmniejszyć ilość danych do przechowywania, Veeam Backup & Replication wykorzystuje deduplikację. Wykrywa powtarzające się bloki i w kopii zapasowej przechowuje je jako jeden. Uzyskujemy w ten sposób znaczne ograniczenie ilości danych do przechowywania, co zmniejsza nam koszty backupu. Ma to również ten skutek, że skraca się czas tworzenia kopii oraz ilość danych do przesłania przez sieć, co nabiera szczególnego znaczenia, gdy mówimy o korzystaniu ze zdalnej lokalizacji, np. chmury.
Administrator otrzymuje jeszcze inne funkcje pozwalające ograniczyć rozmiar backupu. Dzięki tworzeniu kopii przyrostowych w kolejnych kopiach zapisywane są tylko zmienione bloki. Narzędzie obsługuje tzw. thin-provisioning, funkcję wbudowaną w platformy wirtualizacyjne, a służącą do redukcji rozmiarów dysków wirtualnych. Potrafi też wyłączyć z backupu niepotrzebne dane, np. pliki wymiany (swap file), migawki czy różne pliki konfiguracyjne. Do zadań administratora należy wskazanie plików, które nie będą uwzględnianie podczas tworzenia kopii zapasowych.
Najnowsze funkcjonalności
Od wersji 7 Veeam Backup & Replication oferuje wbudowaną funkcję akceleracji sieci WAN. Jak przekonuje producent, zastosowanie tego mechanizmu pozwala przyspieszyć transfer w sieciach rozległych nawet 50-krotnie. W tej wersji aplikacji rozszerzono również funkcje bazujące na migawkach SAN, dzięki którym możliwy jest bezpośredni dostęp do VMFS i możliwość śledzenia zmienionych bloków w środowisku VMware. Efektem jest znaczna poprawa wskaźnika RPO. Ta funkcja obsługuje obecnie pamięci masowe HP StoreVirtual VSA, HP StoreVirtual oraz HP StoreServ.
Wśród pozostałych nowości warto wspomnieć o wtyczce do vSphere Web Clienta, która umożliwia monitorowanie infrastruktury kopii zapasowych bezpośrednio z poziomu narzędzi administracyjnych VMware. Veeam Backup & Replication 7 wprowadza też kilka nowych funkcji dla środowiska Hyper-V. SureBackup automatycznie weryfikuje możliwość odzyskania danych z kopii zapasowych, U-AIR umożliwia szybkie odzyskiwanie obiektów z dowolnej zwirtualizowanej aplikacji bez udziału agenta, natomiast On-Demand Sandbox tworzy odizolowane środowisko testowe. Użytkownicy Microsoft SharePoint docenią narzędzie Veeam Explorer, który służy do wyszukiwania i szybkiego odzyskiwania konkretnych elementów z kopii baz danych tej platformy pracy grupowej
Aplikacje oferowane przez Veeam można pobrać ze strony www.veeam.com/downloads/?ad=top-sub-menu. Producent udostępnia w pełni funkcjonalne 30-dniowe wersje trial, bądź wersje bezpłatne, ale pozbawione niektórych funkcji. Zaletą jest możliwość wykupienia licencji korporacyjnej przez użytkowników, którzy rozpoczną korzystanie z programu od wersji bezpłatnej.