Top.Mail.Ru
КОНФИГУРАТОР Серверы
Сетевое оборудование
СХД
IP-телефоны IP-камеры Источники бесперебойного питания (ИБП) Комплектующие Готовые решения -40 % Серверы под задачу
О компании Купить в лизинг Блог Отзывы Доставка Гарантия Контакты Работа у нас Реквизиты Спецпредложения Игровые ПК на ISKRAPC Заявка в тех поддержку
Эксперты в подборе IT-оборудования

Как правильно спланировать аварийное восстановление: определение уязвимых мест

12 сентября 2019

Нет абсолютно устойчивых инфраструктур. Причина сбоя может быть внутри системы, снаружи, в человеке, в железе, в конкуренте, во внезапной катастрофе - восстанавливать работу все равно придется вам, причем максимально оперативно. Чтобы правильно спланировать аварийное восстановление системы сначала нужно определить ее уязвимые места.

В общем виде вам обязательно необходимо будет сформировать план, по которому нужно будет действовать в случае отказа системы. В нем должны быть просчитаны все наиболее вероятные сценарии сбоев и оптимальные сценарии восстановления. График, ресурсы, бюджет - все это должно быть заранее согласовано с начальством. Но начинать этот план нужно с определения уязвимых мест - именно вокруг них и будут строиться прорабатываемые сценарии.

Итак, с чего же начать?


Критические сервисы

Зачем нужна оперативность в восстановлении инфраструктуры? Чтобы восстановить нормальную работу предприятия. А какие сервисы критичны для этой работы? Вот это-то и главное для восстановления системы! Работа пользователей. Если у вас в сервере откажет жесткий диск, но мгновенно вступит в работу резервный, а пользователь даже не заметит этого, то и восстанавливать систему не нужно будет - ввести, разве что, новый резервный диск взамен отказавшего. А вот если резерва сломанной комплектующей нет, то жаловаться на нее пользователь не станет - он пожалуется на отказавший сервис. Обычно это:

  • почта,
  • телефония,
  • принтеры,
  • интернет,
  • файловое хранилище,
  • 1С и т.д.

Скорее всего у вас и так есть список критически необходимых для работы предприятия сервисов, вот на них и нужно сосредоточиться - рассмотреть их со стороны уязвимостей.


Точки отказа

Итак, отказывает критически важный сервис, но чинить нам придется не его, а какой-то участок IT-инфраструктуры. Участки, которые приводят к такой ситуации, которые в случае отказа останавливают или серьезно замедляют или ухудшают работу критических приложений, называются "точками отказа". Наша задача - найти их все!

Это, впрочем, может быть и неподъемной задачей - зависит от вашей компетенции. Например, если у вас ее хватает, вы можете локализовать в модульном маршрутизаторе несколько блоков, которые в случае аварии можно заменить, а если не хватает, то пометить точкой отказа сам маршрутизатор.

Так что в этом поиске вам нужно будет найти золотую середину самостоятельно, но вам точно нужно будет поискать точки отказа в:

  • Оперативной системе сервера.
  • Почтовом приложении сервера.
  • Коммутаторе ядра.
  • Внешней DNS-зоне.
  • Системе электроснабжения.
  • Системе кондиционирования.

Само собой, это те опасности, которым подвержены вообще все инфраструктуры, и вы, конечно, найдете в своей еще множество точек отказа.


Уточняем зависимости

Некоторые точки отказа могут быть созависимы. Например, при дурном стечении обстоятельств у вас может выйти из строя сначала почтовая служба сервера, а потом какая-нибудь важная комплектующая - и вы не получите об этом почтового извещения.

Или же у вас может "умереть" система электроснабжения в шасси терминального блейд-сервера - все сервисы на нем, естественно, остановятся.

Чтобы иметь возможность противодействовать таким сбоям, вам нужно будет составить "карту" точек отказа, отдельно пометив среди них взаимозависимые.

 
Поделитесь статьей в соцсетях   
 
Вам также может быть интересно

Товар добавлен в список сравнения
Перейти в сравнение
Продолжить просмотр
Подбираете сервер для 1С?
Подпишитесь на специальную серию писем про выбор и настройку сервера под 1С
Подписаться
Боитесь неправильно выбрать сервер?
Оставьте свой email, и мы пришлем чек-лист с 5 самыми распространенными ошибками
Получить чек-лист
Нажимая кнопку "Получить чек-лист", вы даёте согласие на обработку персональных данных
Заявка в тех поддержку
Заказать консультацию
IT-архитектор подберет сервер под вашу задачу
Заказать сервер
Мы свяжемся с вами в течение 15 мин
Заявка на лизинг