W ciągu mijającej dekady ogromnego znaczenia nabrały wszelkiej maści rozwiązania do zarządzania informacją. Wśród nich są systemy umożliwiające zapanowanie nad ogromną ilością plików krążących po korporacji i jej oddziałach. Dziś, gdy dostęp do coraz większej liczby plików jest ogniwem w procesach biznesowych, już nie tylko w ramach lokalnej sieci jednej firmy, ale w sieciach rozległych i pomiędzy wieloma oddziałami (lub wręcz oddzielnymi firmami), wymagany jest szybki dostęp do nich i możliwość ich przetwarzania w czasie rzeczywistym.
Analogiczny przełom miał miejsce kilkanaście lat temu, gdy dzięki szybko rosnącej popularności sieci SAN ułatwione zostało przeprowadzenie blokowego zapisu danych i zarządzanie nim. Ułożenie systemów pamięci masowych w architekturę sieci pozwoliło na znaczną redukcję kosztów i poziomu skomplikowania zarządzania dużymi bazami danych. Poprzez analogię podjęto próbę stworzenia podobnej architektury dla dużych systemów plików rozsianych w wielu oddziałach przedsiębiorstw i zbudowania sieci plików, czyli File Area Network (FAN).
Co to jest FAN?
FAN pozwala na usystematyzowanie wielu istniejących technologii związanych z plikami w przedsiębiorstwach. Celem FAN jest dostarczenie przedsiębiorstwom skalowalnej, elastycznej i inteligentnej platformy, dzięki której będą mogli obniżyć koszty zarządzania przechowywaną w firmie informacją. Architektura FAN ma dostarczyć dotychczas niedostępne poziomy zarządzania plikami i możliwości rozliczania. Oto niektóre z nowych funkcjonalności:
- Obejmująca całe przedsiębiorstwo pełna kontrola nad informacjami zawartymi w plikach, zarządzanie atrybutami plików bazujące na metadanych i treści, niezależne od platformy sprzętowej i systemowej.
- Możliwość określenia praw dostępu użytkowników do plików bazujących na regułach biznesowych (m.in. oddziałach, projektach, położeniu geograficznym), niezależnie od fizycznego umiejscowienia pliku.
- Możliwość elastycznej migracji plików i informacji w nich zawartych pomiędzy rozproszonymi ośrodkami.
- Tworzenie usług zarządzania plikami, które są tworzone jako prawdziwe „usługi” dla całej infrastruktury, a nie wdrażane w poszczególnych silosach aplikacyjnych.
- Możliwość zwiększenia parametru ROI systemu zarządzania plikami w związku z konsolidacją systemów plików i możliwością np. wyeliminowania duplikatów.
Wszyscy producenci obecni na rynku rozwiązań FAN zwracają uwagę na konieczność standaryzacji pojęć i stworzenia tego standardu otwartym. Doświadczenia z pierwszych lat obecności sieci SAN na rynku pokazały, że brak jednolitego nazewnictwa oraz powszechnie zaakceptowanych standardów powoduje chaos, brak możliwości rzetelnej edukacji klientów i uczciwej konkurencji. W dalszej części pokazujemy to, z czym obecnie zgadza się już większość firm.
Elementy sieci FAN
Każdą sieć FAN tworzy kilka składników:
1. Pamięci masowe. Pliki w każdej sieci FAN rezydują w infrastrukturze pamięci masowych – może to być zarówno środowisko SAN, jak i NAS. Jedynym wymogiem jest podłączenie pamięci masowych do sieci, aby było możliwe współdzielenie danych.
2. Urządzenia i interfejsy do współdzielenia plików. Mogą być bezpośrednio zintegrowane z infrastrukturą pamięci masowych (np. NAS), albo funkcjonować jako brama-interfejs (np. SAN). Wszystkie sieci FAN muszą mieć urządzenia, które są w stanie dostarczyć informacji o plikach w ramach protokołu CIFS lub NFS.
3. Zbiory nazw. Każda sieć FAN ma mieć przypisany swój własny wirtualny system plików z możliwością przechowywania ich, zarządzania nimi i odczytywania przez uprawnionych użytkowników. Funkcjonalność ta, porównywana do tradycyjnych systemów plików, nazywa jest „zbiorem nazw” (ang. namespace). To jeden z głównych elementów, wokół których oscyluje sieć FAN.
4. Usługi zarządzania plikami. Kolejnym centralnym elementem architektury sieci FAN jest oprogramowanie zarządzające zbiorami nazw. Z perspektywy wdrożenia, usługi te mogą być zintegrowane bezpośrednio z systemami plików lub w urządzeniach sieciowych, ale mogą także funkcjonować samodzielnie. Jako przykłady można wskazać wirtualizację plików, klasyfikację, deduplikację i akcelerację przy przesyłaniu w sieciach rozległych.
5. Użytkownicy końcowi. Są nimi maszyny klienckie, które dostęp do plików uzyskują poprzez systemy plików. Użytkownicy powinni uzyskiwać dostęp z dowolnego urządzenia lub platformy systemowej.
6. Łączność. Jest wiele możliwych dróg do połączenia klientów FAN ze zbiorami nazw. Zwykle są oni połączeni przez standardowy LAN, ale alternatywnie lub równolegle mogą funkcjonować też inne technologie, np. zdalnego dostępu w sieciach rozległych.
Zarządzanie sieciami FAN
Jednym z filarów sieci FAN jest oprogramowanie, które integruje zbiory nazw, fizyczne systemy plików, systemy pamięci masowych i łączącą je sieć. Oprogramowanie to łączy w sobie część istniejących już technologii, ale także ma pewne elementy innowacyjne. Pełni podobną funkcję, jakie oprogramowanie do zarządzania pamięci masowymi pełni w sieci SAN. Oto najważniejsze usługi, które oprogramowanie może realizować w różnych kategoriach produktowych:
- Migracja plików umożliwia szybkie przenoszenie plików pomiędzy współdzielonymi zbiorami nazw. Funkcjonalność ta może być uzyskana na wielu poziomach – w sieci, na dedykowanych urządzeniach lub rozproszonych hostach.
- Wszystkie pliki w sieciach FAN mogą podlegać replikacji pomiędzy systemami pamięci masowych, także rozproszonymi geograficznie. Funkcjonalność tą można uzyskać dzięki wielu technologiom wdrożonym na różnych poziomach infrastruktury (np. host, serwer NAS, sieć). Wsparcie dla replikacji plików jest krytyczne w każdej architekturze FAN.
- Usługi dystrybucji plików pozwalają umieścić je na konkretnych fizycznych urządzeniach, określanych przez właściwości pliku. Dzięki temu najważniejsze pliki mogą być umieszczane na serwerach o najwyższym poziomie dostępności i wydajności. Stan ten można osiągnąć dzięki systemom zarządzania plikami w sieci (Network File Management, NFM), a także technologiom klasyfikacji informacji i zarządzania nią.
- Gdy zbiór nazw został już określony w sieci FAN, użytkownicy powinni mieć do niego ciągły dostęp. W przypadku awarii łącza lub systemu pamięci masowych, odpowiednio przygotowania architektura sieci FAN powinna zapewnić rozwiązanie awaryjne, gwarantujące ciągły dostęp do danych, także z miejsc rozproszonych geograficznie. Ten cel można osiągnąć przez wiele rodzajów narzędzi replikacyjnych, m.in. urządzenia WAFS.
- Klasyfikacja informacji stała się kluczowym elementem wielu systemów. Odpowiednie oprogramowanie pozwala na zindeksowanie dostępnych w plikach informacji, a następnie zapewnia możliwość zarządzania bazującego na politykach i bezpiecznego usuwania danych.
- Geograficzna rozbudowa sieci FAN jest bardzo ważnym czynnikiem dla wielu firm. Aby ją umożliwić, zbiory nazw muszą mieć dostęp do sieci rozległej. Co więcej, problemem nie jest to, aby uzyskać dostęp, ale żeby był on realizowaną z wydajnością podobną do tej osiąganej w sieciach LAN i na podobnym poziomie usług. Umożliwiają to technologie optymalizacji transferu w sieciach WAN.
Zbiory nazw – trzon sieci FAN
Z badań przeprowadzonych przez Taneja Group wynika, że ponad połowa firm na świecie zamierza wdrożyć lub już wdraża zaawansowane rozwiązania umożliwiające zarządzanie plikami. Tym samym zaczynają tworzyć swoją pierwszą sieć FAN, chociaż często nie zdają sobie z tego sprawy. Kluczowym dla nich będzie zrozumienie roli zbiorów nazw w sieci FAN, którą można przyrównać do przełącznika lub directora w sieci SAN, z tą różnicą, że w sieciach FAN mówimy o współzależnościach pomiędzy prezentowanymi informacjami, a nie współzależnościach pomiędzy urządzeniami.
W sieciach FAN mogą funkcjonować trzy rodzaje zbiorów nazw. W najbliższych latach większość firm będzie wykorzystywała wszystkie trzy, wdrożone w różnym stopniu na poszczególnych systemach.
1. Nie współdzielony zbiór nazw. To podstawowa i najpopularniejsza obecnie forma zbioru nazw, gdzie wdrożony jest serwer plików lub tradycyjny serwer NAS. W tej metodzie system plików połączony jest bezpośrednio z systemem na fizycznej maszynie i w ten sposób zbiór nazw jest prezentowany użytkownikowi. Brakuje współdzielenia informacji z innymi systemami plików.
2. Współdzielony zbiór nazw. Występuje wtedy, gdy różne systemy plików łączone są w jeden wirtualny. Najczęściej wykonywany w środowisku homogenicznym i zależny od platformy systemowej. Jego funkcjonalność jest jednak na tyle duża, że pozwala integrować środowiska systemów plików, umożliwia współpracę użytkowników i zdecydowanie poprawia parametry wydajnościowe. Metoda spotykana najczęściej w klastrowych środowiskach NAS i systemach rozproszonych.
3. Globalny zunifikowany zbiór nazw (Global unified namespace, GUN). Całkowicie heterogeniczne środowisko, w którym pliki są dostępne w abstrakcyjnej warstwie wirtualnej, otwarte na wprowadzanie dynamicznych zmian, bazujących na parametrach określonych przez administratorów. Daje możliwość pełnego zarządzania wszystkimi plikami w przedsiębiorstwie. Realizowane przez oprogramowanie, którego inteligencja może udostępniać kolejne funkcje, jak kontrola dostępu, wyższe warstwy wirtualizacji, klasyfikacja, deduplikacja itd. Z punktu widzenia architektury, GUB może zostać stworzone na wiele sposobów, w tym za pomocą oprogramowania na rozproszonych hostach lub specjalnych urządzeniach funkcjonujących w sieci.