Jak stworzyć plan odzyskiwania danych po awarii (DRP)?
W terminologii informatycznej katastrofa to dowolne zdarzenie, które zakłóca działanie sieci, naraża dane na ryzyko lub powoduje spowolnienie lub zatrzymanie normalnych operacji. Plan odzyskiwania danych po awarii (DRP) jest tworzony w celu uwzględnienia ryzyka i możliwości wystąpienia tego typu zdarzeń oraz zminimalizowania szkód, jakie one powodują.
Typowe katastrofy, które są uwzględnione w DRP obejmują:
Złośliwa aktywność/cyberataki
Złośliwe podmioty, złośliwe oprogramowanie, wirusy i zagrożenia wewnętrzne mogą łatwo spowodować kosztowne przestoje i utratę danych. Ponieważ cyberataki stają się coraz częstsze z miesiąca na miesiąc, plany DRP zwykle koncentrują się na tym obszarze ryzyka.
Przerwy w zasilaniu
Operacje muszą być w stanie iść naprzód w obliczu przerw w dostawie mediów, zwłaszcza jeśli są one przedłużone i chaotyczne, jak ma to miejsce w przypadku wielu klęsk żywiołowych.
Awarie sprzętu
Chociaż zespół IT ciężko pracuje, aby wszystko działało, ważne jest, aby mieć plany awaryjne na wypadek, gdyby coś poszło nie tak.
Stany wyjątkowe
Przed 2021 r. wiele organizacji nie przewidywało czegoś takiego jak globalna pandemia w swoich planach na wypadek katastrofy, co ilustruje, dlaczego rozsądnie jest planować odległe scenariusze, a nie tylko te najbardziej oczywiste. W rzeczywistości plan odzyskiwania danych po awarii powinien być dość kompleksowy i nie powinien obejmować tylko scenariuszy, które uważasz za bardzo prawdopodobne. W tym artykule przeanalizujemy ten i inne istotne fakty dotyczące planowania odzyskiwania danych po awarii. Czego dotyczy ten artykuł:
- Czym jest plan odzyskiwania danych po awarii?
- Cztery rodzaje odzyskiwania danych po awarii IT
- Kluczowe elementy DRP
- Kroki tworzenia planu odzyskiwania danych po awarii
Czym jest plan odzyskiwania danych po awarii?
Plan odzyskiwania danych po awarii IT (DRP) to sformalizowany dokument, który organizacja tworzy w celu skodyfikowania zasad i procedur w odpowiedzi na katastrofę. Koncentruje się na sektorach istotnych dla IT, takich jak utrzymywanie sieci i systemów telefonicznych VoIP w trybie online lub ochrona wrażliwych danych za pomocą zasad tworzenia kopii zapasowych. DRP jest składnikiem planu ciągłości działania organizacji (BCP) i podobnie musi być regularnie testowany i aktualizowany, aby zapewnić, że zespół IT może odnieść sukces w odzyskiwaniu danych niezależnie od rodzaju katastrofy. DRP są uważane za niezbędne, ponieważ minimalizują ekspozycję na ryzyko, ograniczają zakłócenia i zapewniają stabilność gospodarczą. Dobrze opracowany i solidny plan może również obniżyć składki ubezpieczeniowe i potencjalną odpowiedzialność, a także zapewnić zgodność organizacji z wymogami regulacyjnymi. Potencjalne oszczędności mogą być szokujące, gdy określi się, jak duże ryzyko finansowe ponosi się bez planu odzyskiwania danych po awarii. Aby określić, ile katastrofa może kosztować organizację, wystarczy wziąć pod uwagę koszty przestoju systemu i utraconych danych. Ile sprzedaży zostałoby utraconych, gdyby strona internetowa lub system telefoniczny nie działały przez kilka dni? Ile godzin podlegających rozliczeniu zostałoby utraconych, gdyby tygodniowe dokumenty zostały przypadkowo usunięte? W przypadku każdej firmy zatrudniającej więcej niż kilka osób, liczby te mogą bardzo szybko rosnąć wykładniczo.
Cztery rodzaje odzyskiwania danych po awarii
Udostępnianie plików to świetne narzędzie produktywności, ale to, o czym naprawdę chcemy wiedzieć, to ochrona i bezpieczeństwo. Taką areną jest backup danych i odzyskiwanie plików.
1) Odzyskiwanie danych po awarii
Ten typ odzyskiwania po awarii uwzględnia cały budynek, w którym znajduje się system komputerowy - centrum danych. Obejmuje to wszystkie funkcje i narzędzia w budynku, takie jak ochrona fizyczna, personel pomocniczy, zasilanie awaryjne, HVAC, media i gaszenie pożarów, które muszą być niezawodne i sprawne. Może również obejmować redundancje, które utrzymują działanie tych systemów w przypadku izolowanych awarii. Planowanie tego typu DR może być bardzo kosztowne, ponieważ wiąże się z wieloma fizycznymi i lokalnymi kosztami oraz utrzymaniem.
2) Odzyskiwanie po awarii w chmurze
Przenosi to wszystkie obciążenia związane z konfiguracją i utrzymaniem witryny na dostawcę usług w chmurze, korzystając z jego centrum danych na podstawie umowy licencyjnej lub kontraktu. Chociaż znacznie zmniejsza to złożoność i koszty dla użytkownika końcowego, jest to bardziej ograniczone niż pełna własność centrum danych. W większości przypadków oszczędności wynikające z tworzenia kopii zapasowych i odzyskiwania danych w chmurzeznacznie przewyższają wszelkie ograniczenia wynikające z braku własnego centrum danych.
3) Odzyskiwanie danych po awarii wirtualizacji
Wirtualizacja jest niezwykle popularna, zwłaszcza w czasach, gdy maszyny wirtualne są bardziej powszechne ze względu na zmiany w sile roboczej. Takie podejście eliminuje potrzebę rekonstrukcji serwera fizycznego w przypadku awarii, znacznie ułatwiając osiągnięcie docelowych celów czasu odzyskiwania (RTO) poprzez umieszczenie serwera wirtualnego w rezerwie lub w chmurze.
4) Odzyskiwanie po awarii jako usługa
Disaster Recovery as a Service (DRaaS) to outsourcowany sposób zabezpieczania odzyskiwania danych po awarii IT przy użyciu różnych podejść. DRaaS może być dostarczany za pośrednictwem chmury lub jako usługa typu site-to-site. Dostawcy mogą przebudowywać i dostarczać serwery do lokalizacji klienta w ramach usługi wymiany serwerów lub mogą wykorzystywać chmurę do przełączania aplikacji w tryb awaryjny, orkiestrować przywracanie awaryjne na przebudowanych serwerach i ponownie łączyć użytkowników za pośrednictwem VPN lub protokołu pulpitu zdalnego.
Kluczowe elementy planu odzyskiwania danych po awarii
Poniżej znajduje się kilka ważnych elementów, które należy uwzględnić w planowaniu odzyskiwania danych po awarii.
-
Ocena wpływu na działalność
Ocena wpływu na biznes (BIA) powinna zostać przeprowadzona przed utworzeniem DRP. Ta kompleksowa ocena ocenia krytyczne systemy firmy i sposób ustalania priorytetów odzyskiwania tych systemów.
-
Cel punktu odzyskiwania (RPO) i cel czasu odzyskiwania (RTO)
RPO określa akceptowalną ilość danych, jaką firma może ryzykować utratą i służy do definiowania częstotliwości tworzenia kopii zapasowych. RTO obejmuje obliczenia i wyznaczanie celów dotyczących czasu potrzebnego na przywrócenie systemu po awarii. Dowiedz się więcej o różnicy między RPO a RTO.
-
Zasób przechowywany poza siedzibą firmy
Serwery zapasowe, sprzęt i inne materiały niezbędne do procesu odzyskiwania danych po awarii powinny być przechowywane w miejscu oddalonym od głównego biura. To, jak daleko lub w ilu różnych lokalizacjach, będzie zależeć od planowanych scenariuszy katastrofy. Na przykład, jeśli główna lokalizacja znajduje się na obszarze podatnym na powodzie, lokalizacja poza lokalizacją może być oddalona o setki kilometrów. Przeczytaj nasz przewodnik po rozwiązaniach do tworzenia kopii zapasowych aby dowiedzieć się więcej na temat korzystania z rozwiązań do tworzenia kopii zapasowych i odzyskiwania danych w chmurze.
-
Plan komunikacji
DRP powinien ułatwiać szybką i łatwą komunikację między wszystkimi pracownikami i dostawcami usług, którzy są niezbędni w procesie odzyskiwania danych. Powinien on również ustanawiać i definiować role i obowiązki wszystkich osób podczas katastrofy.
-
Jasne i bezpośrednie instrukcje
Najlepsze DRP są podzielone na listy kontrolne, dzięki czemu użytkownicy nie muszą czytać setek stron, gdy reagują na bezpośrednie zagrożenie.
Dziewięć kroków do stworzenia planu odzyskiwania danych po awarii
Każda firma potrzebujeplanu odzyskiwania danych po awarii, który jest tak unikalny, jak jej wymagania dotyczące danych. Aby określić najlepsze podejście dla swojej firmy, należy rozważyć wartość danych, systemów i aplikacji w stosunku do ryzyka, na jakie organizacja może sobie pozwolić. Podczas tworzenia planu odzyskiwania danych po awarii należy uwzględnić następujące kroki:
1) Uzyskanie zaangażowania w całej organizacji
Wszyscy w organizacji muszą być świadomi i zdolni do wspierania i realizacji planu odzyskiwania danych. Właściwe planowanie rozpocznie się na samym szczycie, ponieważ kierownictwo/właściciele muszą sami wspierać i być zaangażowani w rozwój procesu planowania odzyskiwania danych po awarii, zapewniając odpowiednie zasoby do realizacji tego zadania.
2) Powołanie komitetu ds. planowania
Należy zorganizować grupę interesariuszy w celu nadzorowania rozwoju i wdrażania planu odzyskiwania danych po awarii. W skład komitetu ds. planowania powinni wchodzić przedstawiciele wszystkich obszarów funkcjonalnych organizacji oraz kluczowi członkowie z odpowiednich sektorów, takich jak IT i zarządzanie operacjami.
3) Przeprowadzenie analizy ryzyka i analizy wpływu na biznes
Komitet DRP powinien przygotować zarówno analizę ryzyka, jak i analizę wpływu na biznes, aby ustalić podstawy planowania. Oceny te powinny obejmować szereg katastrof, w tym zagrożenia naturalne, techniczne i ludzkie. Każdy sektor w organizacji powinien zostać przeanalizowany w celu określenia potencjalnego zagrożenia i wpływu prawdopodobnych scenariuszy katastrof. Problem wynikający z tej funkcji polega na tym, że powszechne ataki ransomware i szyfrujące zwykle zmieniają nazwy i szyfrują pliki na dyskach ofiary. Jest to robione celowo, aby ominąć historię wersjonowania i kosz, aby nie było łatwo odzyskać pliki.
4) Priorytetyzacja operacji
Krytyczne potrzeby każdego działu powinny zostać ocenione w obszarach takich jak personel, dane/dokumentacja, polityka, usługi i systemy przetwarzania. Ważne jest, aby określić maksymalny czas, przez jaki dany dział może funkcjonować bez każdego krytycznego systemu. Komitet planowania powinien również określić krytyczne potrzeby każdego działu, aby lepiej ustalić priorytety odzyskiwania i alokacji zasobów awaryjnych. Wszystkie operacje powinny zostać sklasyfikowane jako istotne, ważne lub nieistotne w zależności od ich priorytetu.
5) Kodyfikacja strategii odzyskiwania
Należy zbadać i ocenić praktyczne alternatywy dla utraconych lub przestarzałych zasobów IT w przypadku katastrofy. Ważne jest, aby wziąć pod uwagę wszystkie normalne aspekty operacji przy wyborze tych awaryjnych lub nadmiarowych rozwiązań. Ta część planu będzie zazwyczaj zawierać szczegółowe informacje na temat zakupu i utrzymania narzędzi i zasobów awaryjnych - tj. rozwiązań do tworzenia kopii zapasowych i odzyskiwania danych - a także siły roboczej i innych kwestii wymaganych do utrzymania ich w stanie gotowości.
6) Zbieranie danych
Ważne dane powinny być gromadzone i przechowywane. Zalecane gromadzenie danych może obejmować: Dokumentacja kopii zapasowych i odzyskiwania
- Krytyczne numery telefonów
- Inwentaryzacja sprzętu komunikacyjnego
- Dokumentacja wewnętrzna
- Dzienniki zarządzania zasobami
- Polisy ubezpieczeniowe
- Inwentaryzacja sprzętu sieciowego
- Główna lista kontaktów dostawców
- Lista kontrolna powiadomień
- Spis lokalizacji przechowywania poza siedzibą firmy
7) Zorganizowanie i udokumentowanie pisemnego planu
Plan powinien zawierać wszystkie szczegółowe procedury, które mają być stosowane przed, w trakcie i po katastrofie. Obejmuje to politykę utrzymywania i aktualizowania planu w celu odzwierciedlenia wszelkich istotnych zmian w organizacji, a także proces regularnego przeglądu. W celu łatwego wdrożenia, DRP są zazwyczaj podzielone na zespoły i delegowane obowiązki. Zespół zarządzający jest szczególnie ważny, ponieważ koordynuje proces odzyskiwania. Powinny istnieć zespoły odpowiedzialne za główne funkcje, w tym:
- Funkcje administracyjne
- Obiekty i operacje
- Łańcuch dostaw i logistyka
- Wsparcie użytkownika/obsługa klienta
- Tworzenie kopii zapasowych komputerów i IT
- Przywrócenie usług
8) Przetestuj plan
Wszystkie plany awaryjne powinny być regularnie testowane i oceniane. Procedury przejścia tych testów powinny być ściśle udokumentowane. Bez testów nie można stwierdzić, czy wszystkie aspekty scenariusza awaryjnego zostały uwzględnione w DRP, dopóki nie jest za późno. Wstępny test zapewni informacje zwrotne dotyczące wszelkich dalszych kroków, które mogą wymagać uwzględnienia, zmian w procedurach, które nie są skuteczne, oraz innych dostosowań w celu poprawy skuteczności. Testy te mogą mieć formę list kontrolnych, symulacji lub rzeczywistych wymuszonych przerw w dostawie prądu. Oczywiście najlepiej jest przeprowadzać te testy poza godzinami pracy, aby zminimalizować zakłócenia w organizacji.
9) Zatwierdzenie i wdrożenie
Po opracowaniu i dokładnym przetestowaniu planu odzyskiwania danych po awarii powinien on zostać zatwierdzony przez kierownictwo organizacji. Kierownictwo jest odpowiedzialne za:
- Ustanowienie zasad, procedur i obowiązków w zakresie planowania na wypadek katastrofy, a także wstępne utworzenie komitetu
- Coroczny przegląd i zatwierdzanie planu awaryjnego, a także prowadzenie dokumentacji przeglądów i testów pod kątem odpowiedzialności i zgodności z przepisami
- Zapewnienie kompatybilności DRP z wszelkimi sprzedawcami lub dostawcami usług
Wnioski
Stworzenie planu odzyskiwania danych po awarii jest niezbędne dla zapewnienia przetrwania każdej organizacji zależnej od technologii. Skuteczne planowanie oznacza znalezienie rozwiązań odzyskiwania po awarii, które pasują do unikalnych wymagań IT i są praktyczne w zarządzaniu i testowaniu. Wiele małych i średnich firm decyduje się na współpracę z dostawcami usług zarządzanych (MSP), aby zrównoważyć obciążenie związane ze specjalistyczną wiedzą, podczas gdy inne zwracają się bezpośrednio do narzędzi takich jak NinjaOne, które pozwalają im wykorzystać specjalnie opracowaną technologię w celu uproszczenia odzyskiwania danych po awarii IT. Takie narzędzia sprawiają, że czynności takie jak konfigurowanie kopii zapasowych, testowanie przełączania awaryjnego i uruchamianie nowych systemów po awarii są niezwykle łatwe. Niezależnie od tego, czy Twoja organizacja chce utrzymywać administrację IT we własnym zakresie, czy zlecić ją na zewnątrz, NinjaOne daje Ci możliwość zapewnienia ciągłości biznesowej dzięki szybkiemu przełączaniu awaryjnemu krytycznych obciążeń do naszych zdalnych, bezpiecznych centrów danych. W przypadku katastrofy możesz polegać na natychmiastowej dostępności danych i funkcjonalnych systemach dzięki infrastrukturze opartej na chmurze, która jest wystarczająco odporna, aby zaufały jej tysiące użytkowników NinjaOne i dostawców IT. Niezależnie od napotkanych niepewności, NinjaOne będzie cennym elementem planowania na wypadek awarii. Jeśli jesteś gotowy, aby przekonać się o zaletach, zapraszamy do zarejestrowania się na bezpłatny okres próbny już dziś.