• При каком уровне нагрузки ЦОД надо начинать закупку дополнительных новых ИБП? Задокументировано ли это, есть ли планирование, можно ли все подтвердить документально?
• Какие риски существуют на данный момент для вашего ЦОД? Где это задокументировано?
• Что такое парные нагрузки? Как вы контролируете парные нагрузки? Какие именно парные нагрузки контролируете?
• Спросите о выведенном из работы оборудовании, которое вы отметили в прошлой части во время обхода. Есть ли соответствующие записи в отчете дежурных за смену?
• В каком виде и где хранится текущая документация по эксплуатации, внутренние политики и процедуры?
Затем посетите дежурную смену без руководителя и спросите по очереди дежурных инженеров (лучше в режиме один на один):
• За оперативное управление какими системами отвечает дежурный? Почему и где это записано?
• Кому дежурный отправляет отчеты при передаче смены? Почему и где это записано?
• Использует ли дежурный на обходе чек-лист? Почему и где это записано?
• Как дежурный контролирует работу подрядчиков? Почему и где это записано? (Во всех этих ответах информация должна совпадать с рассказом главного инженера.)
• В каком штатном положении должны быть выключатели из щита, который вы отметили? Почему и где это записано?
• В каком штатном положении должна быть задвижка, которую вы отметили? Почему и где это записано?
• Что хранится на полки Х стеллаже Y склада? Сравните данные из файла учета склада с фотографией, сделанной ранее.
• В какой момент надо заказывать материалы на склад? Почему и где это записано?
• Что дежурный будет делать в случае пожара, повышения температуры, отключения внешнего электроснабжения (любая аварийная ситуация на ваш выбор) и почему именно так? Может ли он рассказать, когда он в последний раз тренировался действовать в такой ситуации?
• Когда следующая тренировка у дежурного и на какую тему?
• Где хранится отчет о последнем ТО оборудования, за которое отвечает дежурный?
• Опять спросите о выведенном из работы оборудовании. Есть ли эти данные? Совпадают ли с информацией главного инженера?
Методики оценки
В беседах с персоналом, от руководителей до инженеров (в последнем случае это особенно важно), мы всегда оцениваем три вещи, на которые ориентируются практически все аудиторы. Для оценки используется принцип PDCA: Plan – Do – Check – Act, где:
• PLAN – установлены ли цели, запланированы ли ресурсы, процессы?
• DO – выполняется ли запланированное?
• CHECK — отслеживается и измеряется ли этот процесс? Есть ли понимание, что должно быть на выходе? Как это проверяется и каким способом?
• ACT – есть ли действия по улучшению процесса по выявленным замечаниям?
Применительно к процессу эксплуатации ЦОД приведем простой пример.
Для оценки регулярного технического обслуживания мы проверяем календарь технического обслуживания (выполняем PLAN ), далее смотрим, выполняются ли в сроки задачи ТО, есть ли отложенное обслуживание (выполняем DO ). Каковы результаты выполненного ТО? Есть ли подтверждающие документы? Ведется ли контроль качества выполнения работ? Указано ли это в явном виде (выполняем CHECK )? И далее – смотрим, были ли замечания во время ТО (выполняем ACT ).
Uptime Institute предлагает более сокращенную версию, соответствующую тем же принципам:
• Проактивность. Есть ли совершенствование процессов, процедур?
• Практическое использование. Применяются ли в реальности описываемые в документах процессы, процедуры?
• Информированность. Все ли сотрудники знают о документах, необходимых им для выполнения служебных обязанностей? Знают ли места хранения?