Wdrożenie Disaster Recovery (DRaaS) –Case Study

Andrzej Baranowski, 8 września 2020

Ciągłość działania firmy to w dużej mierze zapewnienie nieprzerwanego działania systemów informatycznych. Coraz więcej firm decyduje się na wdrożenie rozwiązań typu Disaster Recovery. Dziś nie są one związane z ogromnymi kosztami i można je nabyć w formie usługi DRaaS. Jedną z usług w ofercie Cloud4You jest właśnie usługa DRaaS.

W tym artykule przedstawię proces wdrożenia takiego rozwiązania u jednego z naszych klientów.

Dostaliśmy zapytanie od klienta, aby zaprojektować i wdrożyć DRP. Po spotkaniu okazało się, że chodzi o średniej wielkości firmę, około 50 pracowników. Każdy z pracowników posiada komputer w domenie, na którym pracuje zarówno w biurze, jak i zdalnie korzystając z połączenia VPN. Wszystkie serwery znajdują się w serwerowni w firmie.

Podczas spotkania zostały ustalone krytyczne aplikacje oraz funkcjonalności, dla których musimy zapewnić ciągłość działania, opisać to procedurą DRP i testować regularnie.

Klientowi zależało na częściowym DR, czyli odporności na wystąpienie awarii jednego elementu w produkcyjnym środowisku (np. uszkodzenie jednego serwera), oraz całkowitym DR, czyli przełączeniu całego środowiska produkcyjnego na środowisko zapasowe (np. pożar, zalanie, zniszczenie serwerowni). Określiliśmy parametry RPO i RTO odpowiednio na jedną i cztery godziny. Środowisko zapasowe musi zatem zostać uruchomione maksymalnie w ciągu 4 godzin od wystąpienia awarii oraz akceptowalny poziom utraty danych to 1 godzina.

Przeprowadziliśmy analizę środowiska serwerowego i stwierdziliśmy:

  • wszystkie krytyczne funkcjonalności, na których zależy klientowi, znajdują się łącznie na pięciu maszynach wirtualnych i jednym serwerze fizycznym. Zostały też uwzględnione serwery pośrednie, które nie posiadały krytycznych aplikacji, ale były wymagane do ich działania;
  • jedna z aplikacji do działania wykorzystuje klucz sprzętowy, który udostępnia licencje niezbędne do uruchomienia aplikacji;
  • wszystkie serwery pracują na podstawie Microsoft Windows Server z wykorzystaniem platformy Hyper-V do wirtualizacji;
  • część usług dostępna jest bezpośrednio z Internetu jak np. serwer WWW.

Zaproponowaliśmy rozwiązanie na podstawie Veeam Backup & Replication (VBR) w dwóch wariantach:

  1. środowisko zapasowe (repliki maszyn wirtualnych) znajdować się będą w chmurze Cloud4You. Zostaną w niej przydzielone zasoby zgodne z technologią używaną przez klienta do wirtualizacji, odpowiednią ilością RAM, procesorem oraz ilością miejsca.
  2. dzierżawa od Cloud4You serwera dedykowanego tylko na potrzeby klienta, spełniającego wymogi niezbędne do uruchomienia całego środowiska zapasowego wraz z niezbędnymi licencjami. Jest to rozwiązanie dla firm, które z różnych powodów muszą przechowywać swoje dane na nośnikach, których są właścicielem bądź najemcą.

Po wyborze wariantu pierwszego przystąpiliśmy do przygotowania środowiska produkcyjnego i konfiguracji DR. Niezbędnymi krokami było:

  • zwirtualizowanie fizycznego serwera zachowując wymagania dostawcy aplikacji, która była zainstalowana na tym serwerze;
  • wyeliminowanie klucza sprzętowego i zastąpienie go licencją dostępną w trybie online. Pozostawienie takiego rozwiązania uniemożliwiałoby uruchomienie aplikacji przy pracy w środowisku zapasowym;
  • zainstalowanie i konfiguracja najnowszej wersji Veeam Backup & Replication na nowej maszynie wirtualnej, instalacja agentów, ustawienie monitorowania;
  • na zasobach Cloud4You został wydzielony tzw. Hardware Plan, czyli przydzielenie odpowiedniej ilość vCPU, RAM i przestrzeni dyskowej tak, aby  pokryć zapotrzebowanie wszystkim replikowanych maszyn wirtualnych;
  • konfiguracja szyfrowanego połączenia SSL/TLS między klientem a Cloud4You;
  • ustawienie zadań replikacji maszyn wirtualnych zgodnie z ustalonymi wartościami RPO i RTO.

Łącze Internetowe po stronie klienta miało bardzo ograniczoną przepustowość, a łączna ilość danych sięgała kilku TB. Wykorzystaliśmy mechanizm WAN Acceleration, który poprawiając kompresje danych oraz wykorzystując deduplikacje danych, skraca czas transferu. Dodatkowo korzystając z możliwość VBR, ograniczyliśmy transfer w ciągu dnia do połowy szybkości łącza, natomiast w nocy do 90%.

Ostatnią czynnością była konfiguracja sieciowa. Dla potrzeb klienta przyznaliśmy adresację publiczną oraz ustawiliśmy odpowiednie przekierowania i zabezpieczania odwzorowując sieć w środowisku produkcyjnym.

Replikacja Serwerów

Kolejnym etapem było opisanie całego wdrożonego rozwiązania tworząc Disaster Recovery Plan (DRP). W tym celu przeprowadziliśmy pierwsze testowe przełączenie środowiska, symulując zarówno awarię jednego serwera, jak i całej infrastruktury. Klient podczas testów sam chciał zweryfikować czy uruchomione repliki serwerów pracują z odpowiednią wydajnością oraz czy wszystkie usługi i funkcjonalność wskazane przez niego na początku projektu działają prawidłowo.

Po udanym teście wszystko zostało opisane w DRP i przekazane klientowi do akceptacji. Ustaliliśmy również harmonogram cyklicznego testowania na 3 miesiące.


Dokładny opis wdrożonej usługi, jak i pozostałych oferowanych rozwiązań dostępny jest na stronie Cloud4You.pl

BLOG

Zobacz inne nasze artykuły

Korzyści z wdrożenia ISO27001

Korzyści z wdrożenia ISO27001

W artykule przybliżę czym jest norma ISO27001, dlaczego wdrożyliśmy ją w Support Online, a także jakie korzyści przyniosło naszej firmie jej wprowadzenie. Co to jest ISO 27001? ISO27001 jest międzynarodową normą. Została stworzona do stosowania w organizacjach jako...

Kopie zapasowe – jak to zaplanować?

Kopie zapasowe – jak to zaplanować?

Tworzenie kopii zapasowych jest jednym z najważniejszych procesów w działających środowiskach IT. Mają uchronić przed utratą kluczowych danych dla działania organizacji. Poprawna konfiguracja kopii zapasowej gwarantuje, że po uszkodzeniu infrastruktury IT właściciel...

Sposób na monitorowanie serwerów

Sposób na monitorowanie serwerów

Ciągłe monitorowanie serwerów zapewnia bezpieczeństwo oraz ciągłość działania infrastruktury IT. Sprawdzanie i wychwytywanie najważniejszych wskaźników, takich jak zużycie pamięci, utylizacja procesora, kondycja dysków i podzespołów, zapobiega nieprawidłowościom....