Пять ошибок начинающих администраторов
Каждый системный администратор когда-то с чего-то начинал свою практику и знает, как было бы хорошо, если бы некоторые уроки можно было бы выучить загодя. Вот пять замечаний чего НЕ следует делать для начинающих сисадминов.
Вряд ли они будут интересны профессионалам, хотя окинуть взглядом профессиональный путь и переоценить свои выводы они тоже могут помочь. Итак, что недопустимо в системном администрировании?
Администрировать или конфигурировать систему вручную
Самый частый кейс дурного администрирования – человеческий фактор, которому, естественно, подвержены и сисадмины. Дурацкие ошибки, даже помарки скорее, вырастают в крупные проблемы при ручном управлении или конфигурации системы.
Как с этим справиться? Проще простого: забудьте, что можно ходить на сервер по ssh. Замените этот подход системами управления конфигурациями.
Допускать помехи обновлению системы от сторонних компонентов
Представьте себе такую ситуацию: молодой сисадмин, не знающий rvm/rbenv сталкивается с ruby и отправляется собирать его из исходников на собственном сервере. А потом вдруг получает срочное извещение о необходимости немедленно этот самый ruby обновить, причем не где-то, а на 20 серверах сразу.
Компилировать вручную? Это будет адская работенка. Нужно, конечно, собрать новый пакет на тестовой машине и обновить все серверные устройства централизованно, но что для этого понадобится? Отсутствие сторонних компонентов, мешающих обновлению.
Не стандартизировать
Продолжение первых двух пунктов. Представьте несколько десятков серверов разных производителей, с разными версиями разного ПО… Представьте себе сколько людей и сколько времени нужно, чтобы управлять всем этим хозяйством, чтобы обновлять его, чтобы поднимать в случае чего.
А потом то же самое – но только при стандартизации всех входных: один производитель железа, одно ПО одной версии, полная централизация. И экономия прорыв сил, времени и денег.
А все, что нужно – создать стандарт и следовать ему.
Отсутствие мониторинга и рассылки уведомлений
Метрики и постоянная рассылка электронных писем… Казалось бы, меньше – лучше, но как бы не так. Лучше получать оповещения о каждой мелочи, что о том, что она работает, что о том, что она сломана, - чем по нескольку суток проводить в офисе в попытке все вернуть в норму.
К счастью, сегодня существует просто огромное количество соответствующих сервисов, благодаря которым мониторить можно вообще все. Причем рассылать после этого можно будет не только электронные письма, но также и смс-сообщения.
Отсутствие контроля за файлами
Изменение некоторых файлов, например, конфигурационных, может привести в серьезных сбоях в системе. «Что-то там поправил» один сисадмин, «что-то там подправил» без постановки в известность остальных второй, третий – вот и конфликтная, взрывоопасная ситуация, да еще и падение системы может случиться.
Поэтому все вносимые изменения должны документироваться – автоматически или вручную. Это попросту правило эффективной работы – без «записанных ходов» можно порушить друг другу работу или даже спровоцировать проблемы.