Pożar w centrum danych T-Mobile na Annopolu i jego konsekwencje

W godzinach porannych 31 stycznia 2019 roku, duży pożar hal magazynowych na warszawskiej Białołęce (Annopol) dotknął również sieć T-Mobile. W wyniku incydentu ucierpiały zlokalizowane tam budynki T-Mobile Polska.

Zasady bezpieczeństwa data center

Przebieg i skala pożaru

Pożar rozpoczął się w hali magazynowej z artykułami spożywczymi. Jak donosiło radio RMF, informacja o pożarze pojawiła się około godziny 8:00. Nad halami znajdowała się część biurowa, w tym m.in. call center operatora. Z hal ewakuowano około setki osób, a mł. bryg. Karol Kierzkowski z PSP poinformował, że hala magazynowa była zajęta ogniem w 70 procentach. Hala miała około 150 metrów długości i 20 metrów szerokości. W wyniku pożaru częściowo zawaliła się konstrukcja budynku.

W akcji gaśniczej brało udział łącznie 160 strażaków i 50 samochodów gaśniczych. Strażacy prowadzili działania gaśnicze w części magazynowej, jednocześnie broniąc okolicznych budynków przed przedostaniem się ognia. Na szczęście, żaden z pracowników T-Mobile ani innych osób nie ucierpiał w wyniku zdarzenia, nikt nie odniósł obrażeń. W tej chwili nie wiadomo, co było przyczyną pożaru.

zdjęcie akcji gaśniczej straży pożarnej

Bezpośrednie skutki dla usług T-Mobile

W konsekwencji incydentu, niedostępne stały się niektóre usługi firmy. Brak było możliwości kontaktu z call center T-Mobile, a także niedostępne były niektóre systemy firmy. Przedstawiciele telekomu natychmiast podjęli działania w celu minimalizacji utrudnień i przeprosili klientów za wszelkie niedogodności. Usługa wysyłania SMS-ów mogła być niedostępna, co stanowiło istotny problem, zważywszy na fakt, że Polacy wykazują wysoką aktywność w tej formie komunikacji.

Kod wieczności | NAGRODZONY FILM | Polski Lektor

Działania naprawcze i wyzwania

Operator początkowo ogłosił, że w ciągu 12 godzin udało mu się odzyskać pełną sprawność głównych usług. Jednak 4 lutego T-Mobile wydał kolejny komunikat, informując, że pełna funkcjonalność „niemal” wszystkich usług telekomunikacyjnych w jego sieci została przywrócona. Słowo „niemal” było interpretowane bardzo szeroko, ponieważ po 4 lutego nadal nie działały m.in. usługi Heyah, niedostępna była aplikacja dla klientów „Mój T-Mobile” (umożliwiająca płatności za abonament), ani internetowe biuro obsługi MiBOA. Proces przenoszenia numerów został przywrócony dopiero 7 lutego.

„Dziennik Zachodni”, opierając się na informacjach od swoich czytelników, donosił 5 lutego, że awaria nadal powodowała spore utrudnienia z dzwonieniem i wysyłaniem SMS-ów, a także uniemożliwiała doładowanie konta. T-Mobile, wydając oficjalne komunikaty, mógł chcieć pokazać, że radzi sobie ze spełnianiem określonych wskaźników RTO (Recovery Time Objective - czasu, w którym przedsiębiorstwo może funkcjonować bez procesów o znaczeniu krytycznym) oraz RPO (Recovery Point Objective - akceptowalnego poziomu utraty danych).

Krytyka i wnioski dotyczące bezpieczeństwa data center

Wiele wskazuje na to, że Disaster Recovery Plan (DRP), czyli zestaw procedur niezbędnych do przetrwania firmy w przypadku katastrofy, oraz Business Continuity Plan (BCP), plan ciągłości działania, w przypadku T-Mobile z jakichś powodów nie sprawdziły się w praktyce. Zastanawiające jest, ile podstawowych błędów popełniono.

Lokalizacja i konstrukcja obiektu

Dziwi już samo umiejscowienie data center w sąsiedztwie magazynu, w którym - jak wynika z relacji strażaków - było dużo palnych materiałów, nie tylko artykułów spożywczych, ale i poligraficznych. Takie sąsiedztwo jest sprzeczne z zasadami lokalizowania centrów danych, które powinny znajdować się w miejscu bezpiecznym, z dala od dużych fabryk (zwłaszcza chemicznych), lotnisk czy elektrowni. Sąsiedztwo magazynów może również ułatwiać dostęp do data center wielu osobom.

Inna zasada mówi, że budynek mieszczący data center musi być odpowiednio wykonany, najczęściej z użyciem ścian ze zbrojonego betonu, często z dodatkową ochroną. Patrząc na obiekty, które spłonęły i zapadły się na Annopolu, trudno przypuszczać, by spełniały te wymagania. Strażacy przyznawali, że ochrona części biurowej, gdzie mieściły się biura T-Mobile, przed rozprzestrzenieniem się ognia była bardzo trudna.

Systemy przeciwpożarowe i redundancja

Rodzi się pytanie, czy w obiekcie był odpowiedni system przeciwpożarowy. W przypadku data center najczęściej stosuje się systemy gaszenia specjalnym gazem, który jest neutralny dla człowieka i odcina dopływ tlenu do płonących elementów. Taką instalację trzeba precyzyjnie zaprojektować i wykonać, aby zagwarantować stuprocentową skuteczność.

Mimo tych potencjalnych słabości data center na Annopolu, kłopoty T-Mobile dziwią, ponieważ operator posiada centra danych również w innych lokalizacjach w Polsce, takich jak Piaseczno, Wrocław czy Kraków. Firmy świadczące usługi z zakresu Business Continuity/Disaster Recovery zalecają posiadanie „lustrzanej” infrastruktury w innej lokalizacji. W takim scenariuszu dane są kopiowane do zapasowej serwerowni w trybie ciągłym, co minimalizuje ryzyko ich utraty. Odpowiednia konfiguracja pozwala, by awaria głównej serwerowni pozostała niezauważona. T-Mobile wprawdzie podaje, że np. jego obiekt we Wrocławiu spełnia standardy techniczne i wymogi TIER III, co sugeruje bezpieczniejszą lokalizację.

Badania firmy Veeam z 2017 roku przeprowadzone wśród polskich klientów sugerują, że wiele firm, choć inwestuje w rozwiązania ochrony dostępności usług, nie przeprowadza regularnych testów lub nie tworzy odpowiednich polityk ochrony przed zagrożeniami. Według Veeam, to problem 60% organizacji w Polsce, a 40% zaniedbuje również testy technologii.

tags: #call #center #t #mobile #pozar