Przyczyny występowania i metody rozwiązywania problemów w sieciach LAN

0

Sieć LAN tworzą różne elementy: drukarki, monitory, komputery PC, telefony IP, serwery, urządzenia pamięci masowej, sprzęt sieciowy, oprogramowanie zabezpieczające, aplikacje sieciowe, aplikacje korporacyjne, aplikacje usprawniające pracę biura i inne. Typowe problemy dotyczą kwestii podłączenia użytkowników i wolno działających sieci.

Większość sieci LAN korzysta z Ethernetu – protokołu warstwy łącza danych oraz protokołu IP – protokołu warstwy sieciowej. Urządzenia w sieci są ze sobą połączone fizycznie przy użyciu skrętki miedzianej, światłowodów lub bezprzewodowych punktów dostępowych.

Proponowana klasyfikacja pierwotnych przyczyn problemów LAN:

  • Połączenia miedziane, światłowodowe i bezprzewodowe, czyli warstwa fizyczna. Prawdopodobne przyczyny problemów: uszkodzone lub zanieczyszczone okablowanie lub urządzenia końcowe, nadmierne tłumienie sygnału, iedostateczna przepustowość złączy kablowych, zakłócenia sygnału radiowego (w sieciach bezprzewodowych).
  • Ethernet oraz IP, czyli warstwy łącza danych i sieci. Prawdopodobne przyczyny problemów: uszkodzone urządzenia sieciowe, nieprawidłowe lub nieoptymalne konfiguracje urządzeń, kwestie uwierzytelniania i przyłączania, niedostateczna przepustowość sieci.
  • Przełączniki i sieci VLAN. Prawdopodobne przyczyny problemów: nadmierne wykorzystanie, zbyt wiele błędów, nieprawidłowo przypisane członkostwo VLAN, kwestie pierwszeństwa ruchu (CoS/QoS).

1. Zdiagnozuj problem
Osoba, która powiadomiła o danym problemie, wyjaśnia, na czym polega prawidłowe działanie, po czym przedstawia istotę odnotowanego problemu. Szczególne znaczenie ma ustalenie zakresu problemu i dokładne zdefiniowanie jego charakteru. Powinieneś uzyskać informacje od osoby, która powiadomiła o danym problemie, prosząc o wyjaśnienie, na czym polega prawidłowe działanie, a następnie o przedstawienie istoty odnotowanego problemu.

Jeżeli zgłoszony problem jest opisywany jako występujący sporadycznie, poinstruuj użytkownika, aby skontaktował się z Tobą natychmiast, gdy wystąpi on ponownie. Trudno naprawić coś, co w danej chwili działa prawidłowo.

Nawet jeżeli zgłoszenia użytkowników brzmią nieprzekonująco, nie ignoruj ich. Użytkownik nie dysponuje obszerną wiedzą na temat działania sieci, możliwe więc, że jego opis problemu będzie niefachowy. Coś widocznie zirytowało użytkownika na tyle, że postanowił się z tobą skontaktować

2. Przeanalizuj problem

Sprawdź, czy rozumiesz symptomy. W miarę możliwości samodzielnie zweryfikuj problem, o którym zostałeś powiadomiony. Problemy rozwiązuje się dużo łatwiej, jeżeli ich przebieg może być odtworzony na żądanie. Bezpośrednia obserwacja problemu pozwoli zapoznać się z komunikatami błędów i rozmaitymi symptomami, o których użytkownik mógł nie wspomnieć. To także możliwość zebrania danych statystycznych na temat sieci w czasie samego zdarzenia.

Jeżeli problem występuje sporadycznie, poinstruuj użytkownika na temat prawdopodobnych objawów i przekaż mu listę pytań na piśmie, na które musisz uzyskać odpowiedzi. Może Ci w tym pomóc sam użytkownik, zdobywając pewne informacje w sytuacji, gdy nie będziesz w stanie zareagować wystarczająco szybko. Jeżeli tylko masz możliwość, zastosuj narzędzie diagnostyczne, gromadzące informacje w sposób ciągły. Analizator protokołu może wówczas samodzielnie gromadzić informacje na temat ruchu danych w sieci i nadpisywać bufor wówczas, gdy zostanie zapełniony. Poproś użytkownika, aby przerwał jego pracę lub zachowywał aktualne wyniki testów pochodzące od innych testerów natychmiast po wykryciu sporadycznie występującego problemu.

3. Znajdź przyczynę
Spróbuj ograniczyć przyczynę problemu do danego urządzenia, połączenia lub aplikacji. Po zdefiniowaniu problemu i – w razie konieczności – jego odtworzeniu należy określić, z jakim urządzeniem, połączeniem lub aplikacją jest on powiązany. Ograniczając w ten sposób zakres problemu, można wyodrębnić możliwie najmniejszy element leżący u jego źródła. Przetestuj i wyeliminuj jak najwięcej zmiennych. Być może w tym momencie konieczne okaże się przeprowadzenie skanowania antywirusowego.

Czy brakuje dostępnej zazwyczaj funkcji, czy też mamy do czynienia z nieprawidłową reakcją? Na tym etapie możesz wykorzystać dane zebrane przez narzędzia monitorujące sieć. Ustal, czy w danym komputerze, jego otoczeniu lub w samej sieci były dokonywane jakiekolwiek zmiany tuż przed wystąpieniem problemu. Często użytkownik nie zdaje sobie sprawy, że pozornie niepowiązane modyfikacje (przestawienie przenośnego grzejnika, fotokopiarki, zainstalowanie nowego oprogramowania lub karty sieciowej) mogą skutkować problemami z siecią. Nie należy pomijać środowiska lokalnego podczas szukania zaistniałych zmian. Wahania temperatury (częstym problemem jest zbyt wysoka wartość), zastosowanie urządzeń elektrycznych w sąsiedztwie – nawet w pobliskim zakładzie, zmiany pory dnia oraz wpływ urządzeń elektronicznych także mogą mieć istotne znaczenie. Należy zwrócić uwagę także na ruch windy w sąsiadującym szybie oraz użycie telefonów bezprzewodowych.

Czy dany problem można powtórzyć przy użyciu innego komputera lub z zastosowaniem innego oprogramowania na tym samym komputerze? Ustal, czy problem występuje tylko na jednym komputerze lub w ramach jednego zasobu sieciowego, np. drukarki. Przenieś się o jeden segment bliżej zasobu sieciowego i spróbuj ponownie. Jeżeli w wyniku tej operacji problem ustąpi, przetestuj lub zastąp dany element infrastruktury.

Jeżeli problem dotyczy całego wspólnego segmentu, wyodrębnij problem, redukując w możliwie wysokim stopniu liczbę zmiennych. Spróbuj skrócić odcinki kabli topologii magistrali lub tymczasowo zastosuj topologię pierścieniową lub gwiazdy, aby utworzyć jak najmniejszą sieć w celu rozwiązania problemu. Spróbuj użyć innego przełącznika lub koncentratora. Jeżeli problem występuje na tym samym wspólnym segmencie, co zasób sieciowy, spróbuj wyłączyć lub odłączyć wszystkie komputery, oprócz dwóch. Gdy te dwa komputery będą się komunikować, dołącz kolejne. Jeżeli komunikacja nie będzie możliwa, sprawdź warstwę fizyczną – końcówki kabli, same kable lub określone porty wykorzystywane w ramach infrastruktury (koncentratory i przełączniki).

Jeżeli problem dotyczy pojedynczego komputera, spróbuj użyć innej karty sieciowej, nowej kopii sterownika (nie wykorzystuj oprogramowania sieciowego ani plików konfiguracyjnych znalezionych w komputerze – usuń je, jeżeli okaże się to konieczne). Spróbuj uzyskać dostęp do sieci przy użyciu narzędzia diagnostycznego, korzystając z istniejącego połączenia kablowego z siecią dla tego komputera. Jeżeli połączenie sieciowe wygląda na nieuszkodzone, ustal, czy tylko jedna aplikacja wykazuje obecność problemu. Wypróbuj inne aplikacje zainstalowane na tym samym dysku lub w tym samym systemie plików. Porównaj konfigurację z najbliższym działającym komputerze. Wypróbuj nową kopię oprogramowania (nie korzystaj z dostępnego na komputerze oprogramowania lub plików konfiguracyjnych).

Jeżeli tylko jeden użytkownik spotkał się z danym problemem, sprawdź zabezpieczenia sieci i uprawnienia przyznane temu użytkownikowi. Odszukaj wszelkie zmiany dokonane w zabezpieczeniach sieci, które mogą mieć wpływ na tego użytkownika. Czy usunięto konto innego użytkownika, które miało takie same zabezpieczenia? Czy użytkownik został usunięty z grupy utworzonej w ramach sieci? Czy zmieniono lokalizację aplikacji w sieci? Czy dokonano zmian w systemowym skrypcie logowania lub skrypcie logowania użytkownika? Porównaj konto użytkownika z kontem innego użytkownika, który jest w stanie wykonywać zadania sprawiające w tym wypadku problem. Czy użytkownik może zalogować się i wykonać to samo zadanie z pobliskiego komputera, na którym nie występuje problem? Czy inny użytkownik może zalogować się na komputerze, na którym występuje problem, i wykonać to samo zadanie?

4. Sporządź plan rozwiązania problemu
Zbadaj i rozważ możliwe rozwiązania. Zwróć uwagę, czy dostępne rozwiązania problemu mogą wywołać dalsze problemy. Aby uniknąć niepożądanych powtórzeń i zapewnić możliwość cofnięcia wszelkich wprowadzonych zmian, o ile miałyby one przynieść niekorzystne skutki, starannie dokumentuj wszystkie działania podejmowane w trakcie procesu rozwiązywania problemu. Skopiuj wszystkie pliki konfiguracyjne do bezpiecznego miejsca przed ich modyfikacją – zwłaszcza te, które dotyczą przełączników, routerów, firewalli oraz innych kluczowych urządzeń wchodzących w skład infrastruktury sieciowej.

Warto otworzyć drugą sesję terminala na przełączniku lub routerze, gdzie wpisywane będą polecenia wymagane w celu cofnięcia zmian konfiguracji, które będzie można wykonać przed faktycznym wdrożeniem zmian w pierwszym oknie. To prawdopodobnie najszybszy sposób, w jaki można przywrócić stan przed zmianami mającymi wpływ na sieć.

5. Trzymaj się ustalonego planu
Rozwiązaniem problemu może być wymiana urządzenia sieciowego, karty sieciowej, kabla lub innego komponentu fizycznego. Jeśli problem leży po stronie oprogramowania, konieczne może być zastosowanie poprawki, ponowna instalacja aplikacji lub komponentu, względnie wyleczenie zainfekowanego pliku. Jeśli natomiast problem tkwi w koncie wybranego użytkownika, konieczna może być zmiana ustawień zabezpieczeń lub skryptów logowania.

W przypadku sprzętu sieciowego często celowa jest wymiana części i późniejsza próba jej naprawienia. Inna opcja przewiduje zmianę połączenia z wykorzystaniem portu rezerwowego oraz zasłonięcie lub oznaczenie w inny sposób wadliwego portu. Należy pamiętać, że celem jest możliwie szybkie przywrócenie pełnej funkcjonalności sieci.

Istnieją dwie drogi, które prowadzą do rozwiązania problemów mających związek z oprogramowaniem. Pierwsza opcja przewiduje ponowną instalację oprogramowania sprawiającego trudności wraz z usunięciem plików, jakie mogły ulec uszkodzeniu, przy jednoczesnym zapewnieniu, że wszystkie wymagane pliki będą dostępne. To zarazem znakomity sposób, dzięki któremu można zyskać pewność, że druga opcja – ponowna konfiguracja oprogramowania – zadziała przy pierwszej próbie. Wiele aplikacji pozwala na ponowną konfigurację, podczas której program instalacyjny nie uwzględnia istniejących plików konfiguracyjnych. Sposób ten pozwala uniknąć skutków błędu i jego powtórnego wystąpienia. Jeśli opcja taka nie jest widoczna, zawsze lepiej usunąć aplikację przed jej ponowną instalacją.

Jeśli problem ogranicza się do konta wybranego użytkownika, często szybciej będzie powtórzyć kroki wymagane do przyznania użytkownikowi dostępu do aplikacji lub działań, będących źródłem problemu tak, jakby użytkownik ten nie posiadał wcześniej stosownych uprawnień. Wykonując kolejne czynności w logicznym porządku, prawdopodobnie szybciej zlokalizujesz brakujący lub nieprawidłowy element niż wówczas, gdybyś musiał przeprowadzać wyrywkowe kontrole. W pewnych sytuacjach celowe może się okazać usunięcie danego konta i rozpoczęcie od nowa.

6. Przetestuj, aby zweryfikować kwestię rozwiązania problemu
Po wdrożeniu rozwiązania należy sprawdzić, czy rozwiązano dany problem, prosząc użytkownika o przeprowadzenie testu pod kątem obecności problemu. Poproś także użytkownika o szybkie wykonanie kilku innych zwykłych działań z użyciem danego sprzętu. Zdarza się, że rozwiązanie jednego problemu skutkuje innymi problemami, a czasem wyeliminowanie danego zjawiska ujawnia symptomy problemu leżącego głębiej.

7. Sporządź dokumentację problemu i jego rozwiązania
Z dokumentacji będzie można korzystać w przyszłości w celu usuwania takich samych lub podobnych problemów. Dokumentacji można również użyć w celu przygotowania raportów na temat typowych problemów sieciowych dla potrzeb administratorów lub użytkowników lub w celu szkolenia nowych użytkowników sieci oraz członków zespołu obsługi technicznej sieci.

8. Podziel się danymi zwrotnymi z użytkownikami
Często pojawia się pokusa, aby rozwiązać problem i odejść bez słowa. Tymczasem w przypadku, gdy dany problem zgłosił użytkownik sieci, zapewne zależy mu, aby poznać jego przyczynę. Zachęca to użytkowników do powiadamiania o podobnych sytuacjach w przyszłości, co z kolei zwiększa wydajność sieci.

Jest jeszcze jeden powód, dla którego warto udostępniać informacje zwrotne. Gdyby użytkownik mógł uczynić coś, aby naprawić zaistniały błąd lub zapobiec mu w przyszłości, mogłoby to przyczynić się do ograniczenia liczby problemów z siecią. Dobra współpraca między zespołem obsługi technicznej sieci a społecznością użytkowników pozwala znacząco zwiększyć możliwości utrzymania prawidłowego działania sieci. Lekceważące traktowanie użytkowników lub protekcjonalne uwagi mogą skutkować nieprzyjaznymi relacjami, a w efekcie utrudnić Ci realizację zadań.

Istnieje również powiedzenie, że naprawa problemu w 75% oznacza „naprawę użytkownika”. Jeśli użytkownik neguje potraktowanie problemu w odpowiedni sposób (bo albo go nie usunięto albo nie wyjaśniono użytkownikowi w satysfakcjonujący go sposób, że naprawa nie jest możliwa z następujących powodów technicznych, finansowych lub politycznych…), nie można uznać, że dana misja została zakończona.

Pierwsze działania, które podejmiesz
Uzyskanie niezbędnych informacji powinno być pierwszą czynnością jakiej się podejmiesz przy przystąpieniu do rozwiązywania problemów. Jeśli nie wiesz, jak powinno wyglądać prawidłowe działanie, ani nie znasz użytej technologii, trudno będzie Ci w sposób wydajny zebrać informacje i poznać symptomy konkretnej awarii.

Skorzystaj z informacji uzyskanych na temat pierwszego badanego obiektu, stopniowo poszerzając zasób wiedzy. Podczas dalszych działań kieruj się modelem OSI. Ogromna rzesza starszych specjalistów ds. sieci zapomniała już lub nigdy nie znała podstawowych zasad działania wielu elementów sieci. Technologia w tej branży podlega szybkim zmianom, zaś specjaliści Ci koncentrują się zwykle na aspektach wyższego poziomu, pomijając zagadnienia rozwoju niższych poziomów. W efekcie przyjmują błędne założenia na temat wybranych symptomów, co skutkuje opóźnieniem rozwiązania problemu.

Ponieważ osoby te często zajmują stanowiska, na których podejmowane są decyzje na temat architektury sieci, szereg kosztownych modernizacji jest niepotrzebnie przeprowadzanych. Nikt nie wie wszystkiego, zatem zawsze proś o pomoc w razie wątpliwości. Korzystaj z wielu źródeł, gdy odpowiedź brzmi zbyt prosto, by mogła być prawdziwa lub budzi wątpliwości.

Także kursy i podręczniki nie są źródłem kompletnej wiedzy. Choć udostępniają one jej szeroki zakres w oparciu o bogate doświadczenia, czasem poruszają tematy, które należałoby pozostawić innym specjalistom. Jednym ze znaków na potwierdzenie, że zrozumiałeś dany temat lub koncepcję w wystarczającym stopniu, jest umiejętność wskazania miejsca zjawiska, gdy rzeczywiście ma ono miejsce.

Dobór odpowiednich narzędzi służących zwalczaniu problemów sieci LAN oraz prowadzenie szkoleń w tym zakresie
Odpowiednie szkolenia, właściwe narzędzia i skuteczna metodologia usuwania problemów opracowane dla potrzeb zespołu obsługi technicznej sieci przekładają się na przyspieszenie rozwiązywania problemów LAN. Przenośne testery i analizatory sieciowe pozwalają przyspieszyć przeprowadzanie modyfikacji i rozbudowy, a także realizację zadań związanych z rozwiązywaniem skomplikowanych problemów. Można je zawsze zabrać ze sobą, aby szybko odnaleźć źródło problemu na miejscu.

Tym samym oszczędniej gospodaruje się czasem pracowników obsługi technicznej, szybciej obsługuje karty problemów, ogranicza do minimum czas przestoju, a wreszcie szybciej przywraca się pełną wydajność pracowników.

Autorem jest Piotr Walas, dyrektor ds. technicznych w Passus Sp. z o.o.

BRAK KOMENTARZY

ZOSTAW ODPOWIEDŹ