Jeszcze kilka lat temu wielkie zbiory danych, tzw. big data, stanowiły dla firm poważny problem. Fala informacji o niespotykanej wcześniej skali sprowadziła działy informatyczne do defensywy.
Zarządzając tymi danymi, wiele firm stosowało politykę ograniczania strat, aby nie dopuścić do przeciążenia systemu, i wprowadzało np. limity wielkości kont pocztowych pracowników. Inaczej mówiąc, podchodziło do zarządzania danymi w sposób restrykcyjny i defensywny. W ciągu ostatnich pięciu lat podejście to uległo jednak diametralnej zmianie. Dziś firmy nie traktują wielkich zbiorów danych jako problem, ale dostrzegają w nich nowe możliwości. Branża informatyczna stworzyła narzędzia, które umożliwiają gromadzenie, eksplorowanie i analizowanie tych wielkich zbiorów danych, a tym samym – znacznie lepszy dostęp do użytecznych informacji biznesowych. Jeśli firma ma właściwe podejście do big data, zyska bardzo precyzyjne informacje o klientach, procesach i operacjach w czasie rzeczywistym, co ułatwi jej udoskonalanie sposobów pracy.
Zbiory big data są efektem szybkiego wzrostu ilości zarówno danych, jak i ich źródeł. Przykładem mogą być media społecznościowe (na Facebooku codziennie umieszczanych jest 250 milionów nowych fotografii), nadzór wideo, inteligentne liczniki, systemy wydobycia ropy naftowej (platformy wiertnicze generują 2500 punktów danych na sekundę), mobilne czujniki i wiele innych Dzięki tym danym firma może dowiedzieć się znacznie więcej o swoich klientach, a także analizować w czasie rzeczywistym w jaki sposób konsumowane są jej produkty.
Takie nowe modele operacyjne mogą nie tylko stymulować wzrost przychodów i wydajności firm, ale również zmieniać świat na lepsze.
Big data a zdrowszy świat
Jednym z obszarów, w których analityka danych big data przynosi najważniejsze korzyści, jest służba zdrowia. Analiza informacji z tego sektora pozwala na nie tylko wykorzystanie większej ilości informacji, ale również łączenie i porównywanie danych z różnych źródeł. Problemem pozostaje prywatność i bezpieczeństwo danych wrażliwych. Rządy, organizacje służby zdrowia i producenci technologii pracują nad tym, aby wszystkie dane używane w takich projektach były zabezpieczone przed nieuprawnionym dostępem, a informacje o pacjentach miały zagwarantowaną pełną prywatność. Bardzo ważna jest w tym przypadku anonimizacja danych i korzyści związane z postępem w zakresie ich bezpieczeństwa. Gdy problemy te zostaną rozwiązane, zbiory big data będą mogły przynieść sektorowi służby zdrowia nieocenione korzyści.
W sytuacji idealnej każdy pacjent powinien być traktowany indywidualnie, w sposób dokładnie dostosowany do jego potrzeb. Wymaga to uwzględnienia tak zróżnicowanych czynników, jak genom pacjenta, jego dieta, sytuacja społeczna, miejsce zamieszkania, wiek oraz problemy zdrowotne w przeszłości.
Dotychczas tak dokładne dostosowanie terapii do pacjenta nie było możliwe nie tylko ze względu na koszty, ale również brak narzędzi, które umożliwiałyby wyciąganie użytecznych wniosków na podstawie danych pochodzących z różnych źródeł. Wkrótce się to zmieni ponieważ koszty gromadzenia niektórych typów danych naukowych znacznie spadły. Na przykład pięć lat temu uzyskanie sekwencji genomu kosztowało około miliona dolarów, dziś – tylko tysiąc, a niedługo prawdopodobnie obniży się do niespełna stu. W rezultacie pojawi się duża ilość danych medycznych, które, o ile będą odpowiednio przechowywane, eksplorowane i analizowane, pomogą w zapewnieniu pacjentom zindywidualizowanych terapii.
Narzędzia, które umożliwiają przetwarzanie takich ilości danych, są już dostępne. Stoimy u progu nowej ery w medycynie, opisywanej w języku angielskim za pomocą pięciu określeń na literę „p”: predictive (medycyna predyktywna), personalized (leczenie spersonalizowane), pre-emptive (leczenie wyprzedzające), preventative (profilaktyka) i participatory (leczenie z aktywnym udziałem pacjenta). Duże ilości danych, które mają lub mogą mieć związek ze zdrowiem fizycznym, będą łączone i badane na poziomie indywidualnym. Pozwoli to tworzyć plany terapii uwzględniające konkretne okoliczności, co zapewni znaczną poprawę wyników leczenia.
Big data a podejmowanie decyzji
Ilość i jakość informacji, do których ma dostęp społeczeństwo, wpływa bezpośrednio na sposób jego funkcjonowania. Pojawienie się wielu źródeł wysokiej jakości danych zwykle przynosiło społeczeństwom korzyści. Najlepszym przykładem jest epoka Oświecenia, w której wynalezienie maszyny drukarskiej przyczyniło się do rozkwitu nauki i sztuki, co z kolei doprowadziło do liberalizacji prawa i podniesienia poziomu życia. Stwierdzenie, że big data zapoczątkują nowe Oświecenie, byłoby przesadą, ale nie ulega wątpliwości, iż dzięki big data społeczeństwa będą lepiej poinformowane, a to może przynieść tylko pozytywne efekty.
Wyobraźmy sobie, że codzienne wiadomości są agregowane na podstawie większej ilości danych niż dotychczas, dzięki czemu mamy bogatszy i pełniejszy obraz zdarzeń, dostęp do informacji jest w pełni zdemokratyzowany, obywatele mogą analizować szczegółowe dane dotyczące lokalnych społeczności, natomiast władze – lepiej dostosować swoje działania do złożonych okoliczności. Informacja to rzeczywiście potęga. Umożliwia nam podejmowanie właściwych decyzji. Im bogatszymi informacjami dysponujemy, tym lepsze będą nasze decyzje.
Jednym z najnowszych przykładów potwierdzających, jaką rolę mogą odegrać big data w przekształcaniu społeczeństw, była Arabska Wiosna Ludów w 2011 r. W takich krajach, jak Tunezja i Egipt ruchy demokratyczne zawdzięczają swój sukces m.in. temu, że społeczeństwo mogło korzystać z wielu źródeł informacji i powiadamiać za ich pośrednictwem o swoich działaniach.
Big data a lepszy świat
Analitykę wielkich zbiorów danych mogą również wykorzystać instytucje rządowe i organizacje pomocowe, aby zwiększyć skuteczność swoich działań w przypadku kryzysów humanitarnych. Analiza ta umożliwia łączenie różnych źródeł danych geopolitycznych i środowiskowych, co ułatwia reagowanie na zdarzenia w czasie rzeczywistym, a nawet przygotowanie się do nich, zanim nastąpią.
Przykładem jest inicjatywa ONZ pod nazwą Global Pulse, mająca na celu wykorzystanie danych cyfrowych i analiz w czasie rzeczywistym do lepszego zbadania zmian społecznego dobrobytu, aby pomóc najbardziej zagrożonym populacjom i lepiej przygotować świat na przetrwanie wstrząsów globalnych. W ramach Global Pulse gromadzone są tzw. dane pasywne (tj. generowane codziennie przez użytkowników technologii cyfrowych) w celu zobrazowania wpływu katastrof na społeczeństwa oraz efektywności działań pomocowych.
Analityka wielkich zbiorów danych zapewnia o wiele bogatszy obraz zdarzeń niż ten, do którego jesteśmy przyzwyczajeni. ONZ lub organizacje pomocowe mogą teraz tworzyć szczegółowe mapy zdarzeń w poszczególnych krajach oparte na wielu źródłach informacji. Na przykład w regionie dotkniętym suszą można uwzględnić również czynniki geopolityczne lub ekonomiczne, aby sprawdzić, czy istnieje prawdopodobieństwo zamieszek, co pozwoli przygotować bardziej skuteczną strategię.
Big data a czystszy świat
Na podobnej zasadzie analityka big data może odegrać ważną rolę w ochronie środowiska. Pozwala ona stworzyć dokładniejszy obraz wpływu ludzi na środowisko oraz znaleźć sposoby lepszej kontroli zanieczyszczeń i obniżenia zużycia energii.
W każdej chwili prowadzonych jest tysiące eksperymentów sprawdzających, jak zmienia się klimat oraz jaki wpływ na stan środowiska ma zużycie energii i inne działania człowieka. Eksperymenty te, których stopień złożoności i zaawansowania rośnie w tempie wykładniczym, generują ogromne ilości danych. Na przykład zbudowana niedawno największa na świecie macierz hydrofonów (hydrofon to podwodny mikrofon używany do wykrywania trzęsień ziemi oraz gromadzenia pomiarów dotyczących stanu oceanów) wytwarza codziennie tak dużo informacji, że naukowcy realizujący projekt musieli ją podłączyć do swoich laboratoriów za pomocą specjalnego, ultraszybkiego łącza szerokopasmowego. To tylko jeden eksperyment. W każdej chwili przeprowadza się tysiące innych. Łatwo więc sobie wyobrazić ilości danych, które są w związku z nimi wytwarzane
Analityka wielkich zbiorów danych umożliwia łączenie tych informacji oraz tworzenie na ich podstawie szerszych obrazów sytuacji. Każdy eksperyment powiększa ogólne zasoby ludzkiej wiedzy, ale do jego zrozumienia oraz praktycznego wykorzystania danych, które zostały dzięki niemu pozyskane, potrzebne są narzędzia analityczne.
Big data a bezpieczniejszy świat
Jak wynika z powyższych przykładów, analityka danych big data ułatwia nam zrozumienie świata oraz podejmowanie działań, dzięki którym stanie się on lepszy. Kolejnym obszarem, na którym oferuje ona duże możliwości, jest bezpieczeństwo publiczne.
Odpowiednie dane przeanalizowane we właściwy sposób umożliwiają zapobieganie przestępstwom. Nawet jeśli brzmi to mało prawdopodobnie, jest już faktem. Najpierw w Stanach Zjednoczonych, a następnie, w ramach testów, również w Wielkiej Brytanii agencje policji mogą łączyć ze sobą takie informacje, jak wzorce przestępstw oraz dane meteorologiczne i gospodarcze, aby przewidywać, gdzie może dojść do złamania prawa. Wskaźnik sukcesu tych działań wynosi 60%. Na podstawie danych historycznych policja potrafi określić z dużym prawdopodobieństwem, że np. włamanie może się zdarzyć w określonym miejscu i w czasie, a następnie skierować tam siły, aby odstraszyć potencjalnych przestępców. Wykorzystanie big data przez służby mundurowe będzie wymagało przyjęcia odpowiednich regulacji dotyczących poufności, ale wpływ takich analiz na skuteczność walki z przestępczością nie ulega wątpliwości.
W podobny sposób agencje meteorologiczne mogą wykorzystać analizę trendów, aby przewidzieć, gdzie i kiedy mogą wystąpić ekstremalne zjawiska pogodowe. Dostęp do większej ilości danych zwiększa dokładność prognoz. Oznacza to, że ludność może być ewakuowana z zagrożonych terenów nie na kilka godzin, ale na kilka dni np. przed uderzeniem tornada.
Big data są ważne nie tylko dla firm
Często uważa się, że problem wielkich zbiorów danych i ich analityki dotyczy wyłącznie firm, które wykorzystują je do zwiększenia sprzedaży produktów lub lepszego zrozumienia potrzeb klientów. W rzeczywistości mają one dużo większe znaczenie. Dzięki procesom analitycznym opartym na nowoczesnych technologiach możemy lepiej wykorzystać coraz większe ilości danych, które generujemy. W ten sposób big data mogą odegrać ważną rolę w nauce i służbie zdrowia, polityce i rozwoju społeczeństw. Pomogą nam w lepszym zrozumieniu świata i poprawie jakości życia.
Paweł Tokarski, dyrektor techniczny w firmie EMC