КАТЕГОРИИ РАЗДЕЛА

 ПОСЛЕДНЕЕ

Самые резонансные аварии в ЦОД по итогам мая 2023 года

08.08.2023 г. | Раздел: Аварии в ЦОДах, Пожаротушение, Человеческий фактор, Электроснабжение ЦОД

Аварии в ЦОД: новости из Японии, США, Австралии и Китая

24.05.2023 г. | Раздел: Аварии в ЦОДах, Пожаротушение, Человеческий фактор

Аварии в дата-центрах: новости от Vocus, Twitter, Cyxtera и не только

23.03.2023 г. | Раздел: Аварии в ЦОДах, Пожаротушение, Электроснабжение ЦОД

Последствия аварий в ЦОД Lufthansa, Tesla, Oracle, Azure, Twitter

27.02.2023 г. | Раздел: Аварии в ЦОДах, Охлаждение ЦОД, Пожаротушение, Человеческий фактор, Электроснабжение ЦОД

Аварии в ЦОД: новости из Монако, Японии и США

27.01.2023 г. | Раздел: Аварии в ЦОДах, Пожаротушение, Человеческий фактор, Электроснабжение ЦОД

Нормативная документация

Классификация подходов к организации эксплуатации инженерной инфраструктуры ЦОД

21 января 2014 г. | Категория: Эксплуатация ЦОД

Деятельность по эксплуатации инженерных систем дата-центров является важной и зачастую критичной в обеспечении целевых параметров надежности и их соответствия ожиданиям заказчиков и владельцев ЦОД.

I. ВВЕДЕНИЕ В ТЕМУ

1.1. Зачем нужна классификация?

Правильная организация эксплуатации ЦОД может быть средством повышения надежности работы систем дата-центров, влиять на целевые параметры функционирования и даже быть источником повышения рентабельности дата-центров в случае коммерческих предприятий, а также являться источником снижения затрат на эксплуатацию для корпоративных объектов.
 

  

На фото слева направо: Заурбек Алехин, Дмитрий Басистый

Для чего нужна такая идентификация? В первую очередь она, на наш взгляд, необходима для понимания достигнутого уровня развития эксплуатации. А во вторую очередь – для того, чтобы на базе выполненных соотнесений с тем или иным типом подходов (идентификации) разработать правильную стратегию развития процессов эксплуатации ЦОД. Эти два вопроса – неразрывные части единого целого. До тех пор, пока не будет произведена идентификация, не будут понятны главные задачи развития – направления перехода от низших форм к высшим, идеальным формам эксплуатации.

Предлагаемая статья посвящена формированию сравнительной модели, позволяющей для каждого отдельного дата-центра классифицировать и оценивать на верхнем уровне состояние обслуживания инженерных систем ЦОД, а также понимать возможные перспективы и пути развития модели эксплуатации.

1.2. Об истории вопроса

Идея классифицировать анализируемый объект не нова. Стремление классифицировать характерно для любого вида исследований, поскольку позволяет выделять однотипные в том или ином отношении объекты и в ходе последующего анализа выявлять особенности объекта (которые порой могут быть незаметны на общем фоне), являющиеся причиной однотипности значений квалификационных признаков.

В нашем случае объектом исследования является так называемая операционная модель эксплуатации ЦОД. И мы хотим понять, на какие группы могут быть разделены все существующие сегодня в нашей стране варианты отношения к организации эксплуатации дата-центров.

Вообще, под «операционной моделью» мы будем понимать понятие, близкое к тому определению, что приведено в одной из общедоступных энциклопедий (см. [1]), а именно:

Операционная модель – это абстрактное представление применяемых способов и порядка реа­лизации корпоративной стратегии в повседневной деятельности компании. Она объясняет, каким образом компания организует и использует имеющиеся у нее ресур­сы для того, чтобы изо дня в день исполнять текущие опера­ции, наи­лучшим образом воплощая свою бизнес-стратегию.

Исследования операционных моделей различных структур, безусловно, осуществлялись и ранее.

Одним из наиболее значимых оказалась проведенная в рамках MIT’s Sloan School of Management исследовательская программа Management in the Nineties, целью которой было большее понимание роли и влияния информационных технологий на формулирование бизнес-стратегии и структуры предприятий. В опубликованных в начале 90-х годов прошлого века результатах (см. [2], [3]) рассматривают совершенствование организации, основываясь на реинжиниринге бизнес-процессов, адаптации организационной структуры и обеспечении соответствующей квалификации исполнителей.

Результатом усилий явился в том числе и ввод в обращение понятия «операционная модель». При этом к ключевым элементам, характерным для любой операционной модели, стали относить:

• процессы (бизнес-процессы);

• организационную структуру (модель);

• персонал (исполнителей и менеджеров);

• технологии (инструменты);

• информацию (знания, документацию).

Следует отметить, что разнообразные формы активности по изобретению и развитию бизнес-моделей продолжаются, профессиональное сообщество активно обсуждает и применяет различные подходы.

Например, интерес вызвала описанная в журнале Harvard Business Review бизнес-модель, впоследствии получившая название «модель четырех ящиков» (The Four-Box Business Model) ([4]). В качестве наиболее значимых она рассматривает четыре группы параметров: предлагаемую клиенту ценность, формулу прибыли, основные процессы и основные ресурсы. При этом под ресурсами понимаются в том числе: персонал, оборудование, технологии, знания…

Самыми близкими к нашей теме из числа известных и хорошо проработанных могут считаться модели, описывающие деятельность по эксплуатации и текущему управлению информационно-технологическими и телекоммуникационными системами. К первым относятся Библиотека ITIL ([5]) и стандарт COBIT ([6]), ко вторым – eTOM ([7]).

Ну и конечно, наиболее интересно посмотреть модели эксплуатации ЦОД.

К сожалению, нам не удалось обнаружить полностью удовлетворяющую нас классификацию, хотя определенные подходы в данном нап­равлении уже сделаны. Например, в работах Lee Technologies (см. [8])

предложен стандарт по уровням технического обслуживания критической инфраструктуры. При этом целью и основным предназначением стандарта является выбор набора необходимых действий и иных элементов, составляющих техническое обслуживание, для обеспечения соответствующего уровня надежности работы инфраструктуры. В то же время, являясь неким эталоном, стандарт описывает целевое поведение и слабо применим к классификации реального состояния эксплуатации ЦОД в нашей стране, а также не содержит ряда важных, с нашей точки зрения, элементов.

Многие необходимые элементы операционной модели перечислены в стандарте Uptime Institute «Tier Standard: Operational Sustainability» ([9]). Хотя в самом стандарте их наличие или отсутствие является признаком отнесения ЦОД к тому или иному уровню надежности (или операционной устойчивости) и в общем случае не выступает способом классификации модели обслуживания как таковой. Нельзя не отметить, что в тексте стандарта Uptime Institute не используется термин «операционная модель» (operating model).

Кроме этого, заслуживает упоминания модель, разработанная консорциумом The Green Grid, – модель зрелости Data Center Maturity Model (DCMM) ([10]), которая предназначена для повышения уровня энергоэффективности и экологичности дата-центров. Модель охватывает большой пласт форм активности и может быть частично применена и для наших целей классификации после отдельных преобразований и упрощений.

II. КЛАССИФИКАЦИЯ ПОДХОДОВ К ЭКСПЛУАТАЦИИ: ФОРМИРОВАНИЕ КРИТЕРИЕВ И МЕТОДИКА

2.1. Общие пояснения

Представленная в настоящей статье классификация подходов к эксплуатации инженерных систем дата-центров является обобщением знаний, полученных авторами в ходе профессиональной деятельности в областях построения, управления и эксплуатации сложных систем в течение многих лет. Все идеи, высказанные авторами, представляют собой сугубо экспертные мнения, не претендующие на абсолютную истину и не призывающие принять эту классификацию в качестве эталона.

Главная цель представленной классификации – идентификация подходов к эксплуатации инженерных систем дата-центров, а ее основная прикладная задача – обеспечение возможности оценки состояния, рисков и перспектив функционирования ЦОД путем отнесения применяемого подхода к обслуживанию одного из представленных типов.

В качестве базовой основы модели любого типа обслуживания ЦОД мы предлагаем принять необходимость наличия и/или реализации набора элементов, которые объединены нами в следующие группы по ключевым направлениям:

1. Организационная структура.

2. Бизнес-процессы:

a) процессы управления и взаимодействия;

b) процессы обслуживания;

c) обеспечивающие процессы.

3. Ресурсы:

a) персонал;

b) технологии и инструменты;

c) информация;

d) финансы.

При этом, безусловно, глубина и охват реализации соответствующих мероприятий, а также наличие соответствующих элементов являются различными для разных типов обслуживания. На основе оценки подходов к эксплуатации с точки зрения этих характеристик – глубины и охвата реализации – тот или иной подход к эксплуатации инженерных систем ЦОД может быть отнесен к одному из типов, определяемых предлагаемой классификацией.

Исходной точкой, основой классификации, является наша экспертная оценка реалий российской практики, известные нам реализованные на практике подходы к эксплуатации в отечественных коммерческих и корпоративных дата-центрах. Все возможные варианты таких подходов разделены нами на шесть классов по отношению к отказам и авариям оборудования и систем инженерной инфраструктуры дата-центров , а также схеме реагирования на них со стороны службы эксплуатации.

Собственно содержательная часть классификации – это сформи­ро­ванный состав групп мероприятий модели обслуживания и набор па­раметров, описывающих полноту реа­лизации данных мероприятий.

2.2. Группы элементов базовой модели обслуживания

Как было отмечено в предыдущем раз­деле, в основу классификации положена базовая модель обслуживания (эксплуатации) инженерных систем ЦОД, состоящая, по нашему мнению, из трех ключевых направлений (групп элементов). Ниже приведены краткие характеристики каждой группы.

2.2.1. Группа 1. Организационная структура

Говоря об организационной структуре, мы прежде всего имеем в виду то, каким образом построено административное управление в компании. Применительно к организации эксплуатации ЦОД в первую очередь следует учитывать, насколько организационно независимой является служба эксплуатации, какие подразделения участвуют в обслуживании ЦОД и каким образом обеспечивается их взаимодействие на административном уровне.

Особую значимость организационной модели обслуживания придает тот факт, что, несмотря на наличие в компаниях – владельцах ЦОД разных подходов, основным и наиболее эффективным каналом управления остается структурная подчиненность службы эксплуатации дата-центра.

Наличие выделенных штатных образований внутри организации для выполнения задач обслуживания инженерных систем ЦОД является значимым элементом, не только демонстрирующим всей организации важность и в целом статус задач обслуживания, но и способным обеспечить реальную ответственность за их исполнение. И наоборот: будучи «размытыми» между несколькими подразделениями, каждое из которых в свою очередь отвечает за целый ворох задач из разных областей эксплуатации, мероприятия по обслуживанию ЦОД наверняка будут иметь невысокий статус, и отношение к своевременности и качеству их исполнения будет соответствующее.

2.2.2. Группа 2. Бизнес-процессы

Роли и значимости бизнес-процессов посвящено множество материалов, и в настоящее время ни у кого не возникает сомнений в том, что успешность бизнеса в большей степени зависит именно от их эффективности. Все, что делает организация и отдельные ее сотрудники, так или иначе является элементами одного или нескольких бизнес-процессов.

Сегодня существует множество вариантов классификации бизнес-процессов, которые можно использовать для описания деятельности практически любой компании, однако они являются универсальными и несколько сложными для нашей задачи. Для целей классификации подходов к эксплуатации ЦОД мы используем условное деление всех бизнес-процессов на три подгруппы.

Подгруппа 2a. Процессы управления и взаимодействия

Важнейшим элементом с точки зрения обеспечения устранения сбоев и аварий является организация взаимодействия и контроль действий различных участников эксплуатации ЦОД по поиску причин и применению вариантов их устранения.

Кроме самих процессов управления инженерными системами и взаимодействия между участниками этих процессов – персоналом службы эксплуатации дата-центра, к этой группе относятся процессы управления подрядчиками – компаниями, предоставляющими сервисные услуги для инженерных систем, а также отдельный процесс – диспетчерское управление.

Подгруппа 2b. Процессы обслуживания

Для надежного функционирования оборудования инженерных систем ЦОД неукоснительно должны соблюдаться рекомендованные производителями мероприятия по их обслуживанию. Наиболее полный вариант таких мероприятий предполагает наличие детальной информации по порядку обслуживания каждой отдельной единицы оборудования, а также полномасштабное исполнение рекомендованных мероприятий.

К этой группе базовой модели эксплуатации относятся такие виды обслуживания, как регламентное, профилактическое и другие.

Подгруппа 2c. Обеспечивающие процессы

К данной подгруппе мы относим все процессы, реализуемые в ходе эксплуатации ЦОД, которые не входят в две предыдущие подгруппы. Они тоже важны и значимы, поскольку создают условия для исполнения элементов остальных групп и оказывают заметное влияние на полноту и качество их реализации.

К обеспечивающим процессам могут быть отнесены: контроль качества, документирование и другие.

2.2.3. Группа 3. Ресурсы

Для целей классификации подходов к эксплуатации ЦОД мы используем условное деление всех ресурсов службы эксплуатации на четыре подгруппы.

Подгруппа 3a. Персонал

Очевидно, что для выполнения упомянутых выше действий (элементов различных бизнес-процессов) требуются исполнители, обладающие соответствующими знаниями и опытом.

В зависимости от выбранной модели эксплуатации это могут быть собственные сотрудники службы эксплуатации ЦОД либо привлекаемые в рамках договоров сотрудники других компаний. Их количество и доступность также определяются выбранной моделью эксплуатации и обозначенными владельцами дата-центра целями.

В том случае, если основная опора приходится на собственный персонал, дополнительно требуется уделять внимание его обучению и переподготовке, а при приеме на работу – квалификации и накопленному опыту.

Подгруппа 3b. Технологии и инструменты

Технологии обслуживания и инструменты предназначены, с одной стороны, для повышения производительности труда, а с другой стороны – для исполнения отдельных операций, которые невозможно произвести в их отсутствие.

Упоминаемые две стороны являются в значительной степени взаимосвязанными и зависимыми. В то же время можно выделить группы задач с разным уровнем критичности по отношению к обслуживанию отдельных систем и дата-центра в целом. Например, без специальных инструментов в принципе невозможно обслужить кондиционеры или аккумуляторные батареи, а вот система регистрации сбоев может в отдельных случаях быть реализованной в виде простого бумажного журнала (особенно если ЦОД невелик).

Подгруппа 3c. Информация

Мы уже давно смирились с тем, что информация является одним из важнейших ресурсов. При эксплуатации дата-центров значимыми могут считаться данные об объекте, развернутых на нем системах, документация производителей по обслуживанию оборудования, инструкции по реализации тех или иных действий и многое другое.

Подгруппа 3d. Финансы

Действительно, без наличия адекватного финансирования сложно обеспечить любой из перечисленных выше элементов других групп базовой модели эксплуатации – будь то наличие персонала, полнота технического обслуживания, эффективные процессы управления и все остальные.

III. КЛАССИФИКАЦИЯ ПОДХОДОВ К ЭКСПЛУАТАЦИИ: ТИПЫ И ИХ ХАРАКТЕРИСТИКИ

3.1. Типизация подходов

Среди всех выделенных нами подходов к эксплуатации инженерных систем дата-центров могут быть определены шесть различных типов:

• тип A «Усовершенствованный»;

• тип B «Управляемый»;

• тип C «Определенный»;

• тип D «Интуитивный»;

• тип E «Бессистемный»;

• тип F «Неосознанный».

Название каждого из типов характеризует его с точки зрения интегральной экспертной оценки всех элементов базовой модели эксплуатации, отдельные группы которых были определены в предыдущем разделе.

Типы подходов обозначены заглавными буквами латинского алфавита и расположены в этом списке в порядке убывания степени их зрелости и, как следствие, понижения эффективности и надежности эксплуатации инженерных систем дата-центров.

Подход самого низшего, начально­го уровня – тип F «Неосознан­­ный» – с профессиональной точки зрения весь­ма сложно назвать «эксплуатацией». Он добавлен в классификацию по причине широкого распространения в России (по нашему мнению) и является отправной точкой, начальным уровнем для эволюции подходов к эксплуатации – от типа F к типу A. Этот тип подходов также характеризуется тем, что в большей степени, чем другие типы, ориентирован на низкую стоимость эксплуатации и имеет самую низкую надежность функционирования инженерных систем ЦОД в той части, которая напрямую зависит от эксплуатационных процессов.

Типы E, D, C и B являются промежуточными ступенями в развитии подходов к эксплуатации инженерной инфраструктуры дата-центров. Важно то, что эти ступени-типы не надо воспринимать последовательно. (Авторы планируют посвятить отдельную статью вопросам разработки стратегий развития подходов к эксплуатации ЦОД, в которой тема переходов между типами и их последовательность будет раскрыта подробнее.)

Старшая форма подходов к эксплуатации в предлагаемой классификации – тип A «Усовершенствованный», достижение которого демонстрирует наивысшие успехи в построении эксплуатации инженерных систем дата-центров. Он – идеал, который при определенных условиях может даже оказаться избыточным и дорогим удовольствием на фоне предыдущего, вполне совершенного типа. Этот тип подходов характеризуется самой высокой ценой реализации эксплуатационных процессов, но вместе с тем, как закономерный результат этих вложений, позволяет получить гарантированный уровень надежности и эффективности работы инженерных систем дата-центра.

3.2. Общее поле типов и их краткая характеристика

3.2.1. Визуализация типов и оценка долей

Для иллюстрации соотношения между различными типами подходов к эксплуатации инженерной инфраструктуры ЦОД авторами подготовлена диаграмма (см. рис. 1). На диаграмме возможные подходы к обслуживанию ЦОД размещены в координатах «среднее время простоя – цена реализации». Диаметр круга, соответствующего каждому типу, показывает нашу экспертную оценку доли российских дата-центров (в общем объеме), обслуживаемых в соответствии с данным типом (детализацию см. в табл. 1).

Рис. 1. Классификация подходов к обслуживанию инженерных систем ЦОД

Отметим еще раз: приведенные на рис.1 и в табл. 1 оценки являются сугубо экспертными и будут корректироваться по ходу получения более детальной информации. В целом диаграмма предназначена для получения общего представления о соотношении выбранных параметров (надежность, стоимость) типов обслуживания.

Индекс типа

Название типа

Доля, %

A

Усовершенствованный

0 – 1

B

Управляемый

5 – 10

C

Определенный

25 – 30

D

Интуитивный

15 – 20

E

Бессистемный

35 – 40

F

Неосознанный

10 – 1

Таблица 1. Оценки долей различных подходов к эксплуатации (российская практика)

По состоянию на момент подготовки статьи к типу A в полном объеме в России, скорее всего, не может быть отнесен ни один ЦОД. Тем не менее для отражения общей тенденции данный тип на диаграмме тоже представлен, поскольку в настоящее время как минимум три крупных российских дата-центра активно работают над созданием и внедрением моделей обслуживания инженерных систем, совокупность элементов которых позволяет отнести их к этому высшему типу нашей классификации.

3.2.2. Краткая характеристика типов

Тип F «Неосознанный». «Ремонтируем, только когда нельзя не ремонтировать». Организация не понимает необходимости целенаправленной деятельности по обеспечению функционирования инженерной инфраструктуры дата-центра. Функции эксплуатации «размыты» по нескольким подразделениям, включая административно-хозяйственное, ИТ и другие, не подчиненные единому центру. Отдельные отказы игнорируются до тех пор, пока не возникает ситуация невозможности выполнить какую-нибудь значимую бизнес-задачу. В последнем случае инициируются авральные разовые ремонтные мероприятия.

Тип E «Бессистемный». «Системы работают до отказа, далее ремонтируем как можем». В организации выделен ответственный за функционирование инженерной инфраструктуры дата-центра. Деятельность по эксплуатации ориентирована на устранение выявленных отказов по мере возможности и сил. Систематизированный подход к сопровождению систем отсутствует. Имеются отдельные сервисные договоры, в основном – с поставщиками сложного оборудования, в форме естественного продолжения договоров гарантийного обслуживания.

Тип D «Интуитивный». «Предуп­реждаем отказы как умеем». В организации имеется понимание положительного влияния планового обслуживания на снижение количества возникающих отказов. При этом отсутствует единый подход к организации предупредительных работ: обслуживание выполняется выборочно, для отдельных систем, на основании решений ответственных специалистов. Процесс устранения аварий построен неэффективно, мероприятия выполняются по решению отдельных специалистов, без единого контроля и управления. Возможен дефицит ресурсов и квалификаций по отдельным направлениям сопровождения.

Тип C «Определенный». «Системы работают до отказа, далее умеем быстро ремонтировать». Основная эксплуатационная задача состоит в быстром устранении отказов и аварий. В организации работает диспетчерская служба, действует эффективный процесс выявления и устранения отказов по всем инженерным системам ЦОД, включая полноценное покрытие работ собственными или внешними ресурсами. С внешними поставщиками заключены соглашения об уровне сервиса (SLA), обеспечивающие адекватные сроки прибытия специалистов подрядчика на объект и устранения аварий. Организовано обеспечение ЗИП. Профилактическое обслуживание, как правило, не выполняется. Замена оборудования и комплектующих осуществляется только в рамках устранения аварий.

Тип B «Управляемый». «Правильно предупреждаем отказы». Деятельность по эксплуатации построена с учетом передовых рекомендаций и требований. Обеспечено как эффективное устранение аварий, так и плановая деятельность по их предотвращению. Взаимодействие всех служб дата-центра и поставщиков услуг построено на основании прозрачных схем. Штат службы эксплуатации полностью укомплектован, персонал обучен. Осуществляется плановая замена и управление жизненным циклом всех систем в целом. Свое­временно планируются мощностные потребности по критичным системам инженерной инфраструктуры. Построена и функционирует единая централизованная система управления обслуживанием. Обеспечено адекватное и плановое финансирование эксплуатационных задач.

Тип A «Усовершенствованный». «Предупреждаем отказы на ос­но­вании оценки текущего состояния». Деятельность по эксплуатации построена с учетом передовых рекомендаций и требований. Осуществляется управление эффективностью обслуживания на основании мониторинга текущего технического состояния систем и отдельных единиц оборудования. Обеспечено как эффективное устранение аварий, так и плановая деятельность по их предотвращению. Взаимодействие всех служб и поставщиков построено на основании прозрачных схем. Штат полностью укомплектован. Подготовка и развитие персонала осуществляется планомерно, в рамках единой программы. Осуществляется плановая замена и в целом управление жизненным циклом всех систем. Своевременно планируются мощностные потребности по критичным системам. Построена и функционирует единая централизованная система управления обслуживанием. Обеспечено адекватное и плановое финансирование эксплуатационных задач, в том числе и на отдаленную перспективу. Качество реализации эксплуатационных процессов и их полнота подтверждены независимой сертификацией.

3.3. Детальная характеристика типов: реализуемые мероприятия, оценка проблем и рисков

3.3.1. Тип F « Неосознанный»

Данный тип подходов к эксплуатации инженерных систем ЦОД с точки зрения сформированных ранее групп элементов общей модели эксплуатации может быть охарактеризован следующим образом:

ОРГАНИЗАЦИОННАЯ СТРУКТУРА

Выделенного подразделения, ответственного за эксплуатацию дата-центра, не существует. Ответственный за эксплуатацию всей инженерной инфраструктуры не назначен.

БИЗНЕС-ПРОЦЕССЫ

– Процессы управления и взаимодействия. Процедуры управления и взаимодействия не оформлены, исполняются интуитивно, отсутствует представление о процессах и процедурах.

– Процессы обслуживания. Дата-центр воспринимается как «еще одно помещение с размещенным в нем оборудованием». Обслуживание инженерных систем дата-центра осуще­ствляется в рамках общих правил обслуживания инженерных систем организации (бытовых, офисных и других) теми же подразделе­ниями. Отказы обору­до­вания воспринимаются как само собой разумеющиеся (ожидаемые, неизбежные) события и устраняются по мере возможности.

В отдельных случаях, когда в резуль­тате отказа инженерной инфраст­руктуры затрону­ты критичные для бизнеса задачи, его устранение осуществляется в режиме «ручного уп­рав­ления» топ-менеджерами компа­нии.

При этом каких-либо выводов по ре­зультатам такой ситуации не делается.

– Обеспечивающие процессы. Контроль качества, документирование и другие обеспечивающие элементы не реализованы.

РЕСУРСЫ

– Персонал. Штатного расписания службы не существует – используется персонал различных подразделений для решения разовых задач эксплуа­тации. Квалификация персонала не отслеживается и не поддерживается.

– Технологии и инструменты. Обе­с­печение ЗИП не осуществляется. Скорее всего, отдельные системы мо­ниторинга оборудования имеются, но не задействованы в должной сте­пени.

– Информация. Документации поч­ти нет. Если что-то и имеется, то оно недоступно и не используется в те­кущей деятельности.

– Финансы. Целенаправленное фи­нансирование не осуществляется.

Главная проблема данного типа заключается в полном игнорировании необходимости заниматься обеспечением функционирования инженерной инфраструктуры дата-центра на постоянной основе, на базе единой службы эксплуатации. Результатами такого игнорирования является большое число разного рода аварий и сбоев в функционировании дата-центра. Как следствие, организация не только не может адекватно использовать имеющиеся информационные системы, но и развиваться с учетом возникновения новых возможностей, предоставляемых непрерывно совершенствующимися информационными технологиями.

3.3.2. Тип E «Бессистемный»

Данный тип подходов к эксплуатации инженерных систем ЦОД с точки зрения сформированных ранее групп элементов общей модели эксплуатации может быть охарактеризован следующим образом:

ОРГАНИЗАЦИОННАЯ СТРУКТУРА

Выделенного подразделения, ответственного за эксплуатацию дата-центра, не существует. Но может быть назначен ответственный за эксплуатацию инженерной инфраструктуры. Возможно, что также дополнительно назначены ответственные за реализацию отдельных групп эксплуа­тационных мероприятий.

БИЗНЕС-ПРОЦЕССЫ

– Процессы управления и взаимодействия. Управление инцидентами как оформленный процесс отсутствует, выполняется интуитивно. Диспетчерская служба формально отсутствует, ее функции выполняются силами ответственного за работу инженерной инфраструктуры ЦОД и, возможно, его подчиненными (если таковые имеются). Соглашения об уровне услуг (SLA) в части устранения аварий, возможно, существуют для наиболее критичных систем, обслуживаемых внешними поставщиками услуг, но, как правило, малоэффективны; соблюдение SLA не контролируется. Процедуры взаимодействия не оформлены, исполняются интуитивно.

– Процессы обслуживания внедрены частично: только там, где предусмотрены сервисными договорами. В целом компания не рассматривает их как необходимый элемент.

– Обеспечивающие процессы. Контроль качества не осуществляется. Документирование и другие вспомогательные элементы не реализованы вообще или реализованы на основе бессистемного подхода.

РЕСУРСЫ

– Персонал. Оценка численности и комплектование службы эксплуатации персоналом в виде целенаправленной деятельности не осуществляются. Покрытие всех аварийных работ собственными и внешними ресурсами неполное. Квалификационные требования к персоналу не формализованы и не соблюдаются.

– Технологии и инструменты. Пла­но­вое обеспечение ЗИП не осуще­ствляется. Запасные части приобретаются по мере необходимости в случае, если без этого нельзя обойтись. Возможно, существуют локальные системы мониторинга оборудования (появившиеся как часть поставки оборудования и систем).

– Информация. Документации почти нет. Если что-то и имеется, то оно недоступно и не используется в текущей деятельности.

– Финансы. Целенаправленное финансирование не осуществляется.

Основной недостаток данного подхода заключается в том, что ЦОД не воспринимается как важный элемент функционирования компании. Как следствие – отсутствие должного финансирования, невнимание со стороны руководства к необходимости проведения мероприятий по обеспечению его функционирования и предотвращению сбоев.

Последствия существования такого подхода очевидны: говорить о надежности функционирования и доступности инженерной инфраструктуры ЦОД не приходится. Сбои будут, и, возможно, очень серьезные, но поскольку ЦОД не является значимым элементом для бизнеса, то к резонансу и конструктивным выводам со стороны руководства компании – владельца ЦОД они не приведут.

3.3.3. Тип D «Интуитивный»

Данный тип подходов к эксплуатации инженерных систем ЦОД с точки зрения сформированных ранее групп элементов общей модели эксплуатации может быть охарактеризован следующим образом:

ОРГАНИЗАЦИОННАЯ СТРУКТУРА

Выделены несколько групп, ответственных за эксплуатацию отдельных инженерных систем. Одна из этих групп воспринимается как ответственная за эксплуатацию инженерной инфраструктуры в целом, но не имеет для этого достаточных организационных полномочий (только функциональные).

БИЗНЕС-ПРОЦЕССЫ

– Процессы управления и взаимодействия. Управление инцидентами имеет низкий уровень зрелости и работает неэффективно. Диспетчерская служба функционирует как механизм информирования ответственных подразделений о наличии аварии, без выполнения функций координации и контроля исполнения. Соглашения об уровне услуг (SLA) существуют на отдельные системы, но их параметры могут не соответствовать реальным требованиям, к тому же дополнительно они не контролируются. Процедуры взаимодействия обозначены и, возможно, существуют на бумаге, но функционируют с низкой эффективностью.

– Процессы обслуживания. Существуют разрозненные, слабо связанные процессы обслуживания, возможно, не по всем системам. По отдельным, но редким системам осуществляется плановая замена оборудования.

– Обеспечивающие процессы. Контроль качества осуществляется, но без системного подхода, исключительно на основе персональных представлений ответственных. Документирование ведется от случая к случаю, не формализовано, не закреплено как должностная обязанность.

РЕСУРСЫ

– Персонал. В наличии квалифицированный персонал по всем критичным системам. Численность персонала недостаточна для устранения аварий собственными силами. Возможность привлечения ресурсов внешних подрядчиков проработана слабо или отсутствует.

– Технологии и инструменты. Имеется «лоскутная» автоматизация задач эксплуатации и обслуживания систем, возможен прогресс по отдельным системам, по другим – вплоть до полного отсутствия средств автоматизации.

– Информация. Документация есть, в основном активно использует­ся для планирования обслуживания отдельных систем. Существенное внимание уделяется отслеживанию нормативов по замене оборудования. Информационные материалы, предназначенные для улучшения качества устранения сбоев, не считаются значимыми, накапливаются бессистемно и в дальнейшем не актуализируются.

– Финансы. Финансирование осуществляется в приемлемых объемах, достаточных для нормального обслуживания ЦОД (в случае правильного их расходования). При этом выделенный бюджет эксплуатации ЦОД маловероятен. Статьи финансирования приоритетно направлены на закупку нового оборудования и обслуживание действующего; задачи обеспечения эффективного устранения аварий не считаются приоритетными и недофинансированы.

Основные недостатки описанного подхода заключаются в слабом внимании к управлению устранением аварий, в разрозненных мероприятиях по предотвращению сбоев, как правило, проводимых без надлежащего контроля и централизованного планирования. Также к недостаткам этого подхода к эксплуатации стоит отнести отсутствие должного понимания возможных масштабов негативных последствий аварий (возможно, что это связано с регулярным обновлением оборудования и в связи с этим – редкими авариями). Стоит отметить, что для данного типа ЦОД воспринимается руководством компании как важный элемент функционирования компании, но не критичный.

Последствия описанного подхода к эксплуатации реализуются в завышенных издержках на обновление оборудования, в низкой готовности к авариям «нетехнической» природы, в отсутствии гарантии надежности функционирования и доступности инженерной инфраструктуры ЦОД.

3.3.4. Тип C «Определенный»

Данный тип подходов к эксплуатации инженерных систем ЦОД с точки зрения сформированных ранее групп элементов общей модели эксплуатации может быть охарактеризован следующим образом:

ОРГАНИЗАЦИОННАЯ СТРУКТУРА

Выделенное подразделение для эксплуатации инженерной инфраструктуры существует, его задачи четко определены и формализованы (главная задача – быстрое устранение любых сбоев). Назначены ответственные за реализацию отдельных групп эксплуатационных мероприятий.

БИЗНЕС-ПРОЦЕССЫ

– Процессы управления и взаимодействия. Управление инцидентами построено качественно, успешно работает. Диспетчерская служба создана и функционирует. Соглашения об уровне услуг (SLA) в части устранения аварий на все системы, обслуживаемые внешними поставщиками, существуют и относительно эффективны. Процедуры взаимодействия разработаны и внедрены, функционируют эффективно.

– Процессы обслуживания разработаны и внедрены частично – там, где они предусмотрены сервисными договорами. В целом компания не рассматривает их как необходимый элемент.

– Обеспечивающие процессы. Контроль качества не осуществляется. Документирование и другие вспомогательные элементы не реализованы вообще или реализованы на основе бессистемного подхода.

РЕСУРСЫ

– Персонал. Покрытие всех аварийных работ осуществляется за счет собственных и внешних ресурсов. Уровень квалификации достаточен для устранения аварий собственными силами и/или путем привлечения заранее согласованных ресурсов внешних подрядчиков.

– Технологии и инструменты. Осуществляется удовлетворительное обеспечение ЗИП. Построены и функционируют системы мониторинга оборудования.

– Информация. Документа­ция есть, доступна, активно использует­ся. Основной упор – на все, связанное с устранением аварий, включая рабочие инструкции, техноло­гические процедуры. Возможно отсутствие или не­достаточная полнота информации по регламентному обслуживанию, взаимодействию в ходе реализации процессов, не имеющих непосредственного отношения к устранению инцидентов.

– Финансы. Финансирование осуществляется в объемах поставленных задач, выделенный бюджет эксплуатации ЦОД маловероятен.

Основной недостаток данного подхода заключается в отсутствии полноценного свода мероприятий по предотвращению сбоев. Также этому подходу свойственно полностью пассивное реагирование на ситуацию и восприятие аварий как неотъемлемого элемента эксплуатации ЦОД. Тем не менее, высшим руководством компании ЦОД воспринимается как важный элемент для функционирования компании, но не как критичный.

Последствия такого подхода: по мере износа оборудования частота возникновения аварийных ситуаций будет увеличиваться, также будут отсутствовать твердые гарантии надежности функционирования и доступности инженерной инфраструктуры ЦОД.

3.3.5. Тип B «Управляемый»

Данный тип подходов к эксплуатации инженерных систем ЦОД с точки зрения сформированных ранее групп элементов общей модели эксплуатации может быть охарактеризован следующим образом:

ОРГАНИЗАЦИОННАЯ СТРУКТУРА

Выделенное подразделение существует, его задачи определены и формализованы (главная задача – обеспечение надежного и устойчивого функционирования инженерной инфраструктуры ЦОД). Назначены ответственные за реализацию отдельных групп эксплуатационных мероприятий (по всем имеющимся группам мероприятий).

БИЗНЕС-ПРОЦЕССЫ

 Процессы управления и взаимодействия. Управление инцидентами демонстрирует высокий уровень зрелости, работает эффективно. Диспетчерская служба построена в соответствии с передовыми практиками, функционирует исправно и эффективно. Соглашения об уровне услуг (SLA) разработаны и применяются для всех систем, параметры соглашений соответствуют реальным требованиям, обеспечен контроль их соблюдения. Процедуры взаимодействия документированы и реализованы, функционируют эффективно. Управление проблемами реализовано в объеме, достаточном для эффективного реагирования на возникающие инциденты.

– Процессы обслуживания. Существует качественно реализованный процесс управления обслуживанием, охватывающий все системы инженерной инфраструктуры. Ремонт и обслуживание оборудования систем осуществляется в соответствии с рекомендациями производителей. Осуществляется плановая замена оборудования всех систем в соответствии с рекомендациями производителей.

 Обеспечивающие процессы. Осуществляется адекватный контроль качества реализации всех эксплуатационных процессов. Осуществляется планирование загрузки площадей ЦОД. Ведется формализованное документирование.

РЕСУРСЫ

– Персонал. Наличие квалифицированного персонала по всем системам в необходимом количестве. Достаточный уровень квалификации для устранения аварий собственными силами и/или путем привлечения заранее согласованных ресурсов внешних подрядчиков. Осуществляется поддержание квалификации персонала путем регулярного обучения всех сотрудников исполнению процедур обслуживания, регламентов и инструкций.

– Технологии и инструменты. Обеспечение ЗИП осуществляется в полном объеме, в соответствии с требованиями и рекомендациями производителей систем и оборудования. Существуют и эффективно функционируют следующие автоматизированные системы:

• мониторинг параметров систем и оборудования;

• управление системами и оборудованием;

• управление инцидентами;

• управление обслуживанием;

• учет оборудования и систем, их текущего состояния и иных эксплуатационных параметров.

 Информация. Ведется формализованное документирование, на объекте имеется и доступна документация по всем системам и оборудованию.

 Финансы. Финансирование осуществляется в необходимых объемах в форме выделенного бюджета на эксплуатацию ЦОД.

Как таковых недостатков у данного подхода к эксплуатации нет, за исключением требования высокого уровня зрелости организации и обеспечения адекватного финансирования (которое может оказаться значительным). Важной характеристикой уровня зрелости данного подхода является то, что ЦОД воспринимается руководством как важный и критичный элемент функционирования компании в целом.

К возможным последствиям следования описанному типу подходов к эксплуатации можно отнести то, что в случае неисполнения перечисленных выше элементов (требований) может реализоваться риск неэффективного функционирования объекта, что в свою очередь приведет к дискредитации идеи и в итоге – к резко отрицательному отношению к следованию лучшим практикам построения служб эксплуатации. В целом для данного типа ситуация позитивная, имеются твердые гарантии надежности функционирования и доступности инженерной инфраструктуры ЦОД.

3.3.6. Тип A «Усовершенствованный»

Как мы уже упоминали выше, тип А является неким идеальным вариантом, и в настоящее время ему не соответствует ни один реальный российский ЦОД. Требования к данному типу подходов к эксплуатации инженерных систем ЦОД с точки зрения сформированных ранее групп элементов общей модели эксплуатации могут быть определены в основном теоретически (например, по аналогии с уровнем «Оптимизиру­емый» модели CMMI (см. [11]) и иными уже упомянутыми моделями), следующим образом:

ОРГАНИЗАЦИОННАЯ СТРУКТУРА

Выделенное подразделение существует, его задачи определены и формализованы (главная задача – обеспечение надежного и устойчивого функционирования инженерной инфраструктуры ЦОД в краткосрочной и долгосрочной перспективе). Назначены ответственные за реализацию отдельных групп эксплуатационных мероприятий (по всем имеющимся группам мероприятий). Осуществляется мониторинг соответствия процедур взаимодействия организационной структуре, предпринимаются меры по устранению конфликтов и несоответствий.

БИЗНЕС-ПРОЦЕССЫ

– Процессы управления и взаимодействия. Управление инцидентами демонстрирует высокий уровень зрелости, работает эффективно. Осуществляется мониторинг тенденций и проактивное совершенствование процесса. Диспетчерская служба построена в соответствии с передовыми практиками, функционирует исправно и эффективно, мотивирована на самосовершенствование. Соглашения об уровне услуг (SLA) разработаны и применяются для всех систем, параметры соглашений соответствуют реальным требованиям, обеспечен контроль их соблюдения. Организован регулярный пересмотр SLA с учетом прогноза потребностей и изменения эффективности процедур обслуживания. Процедуры взаимодействия документированы и реализованы, функционируют эффективно, организована периодическая их актуализация. Управление проблемами реализовано в полном объеме, включая как обеспечение эффективного реагирования на возникающие инциденты, так и упреждающее выявление потенциальных инцидентов и принятие мер по противодействию им. Качество реализации процессов управления и взаимодействия и их полнота подтверждены независимой сертификацией.

– Процессы обслуживания. Существует качественно реализованный процесс управления обслуживанием, охватывающий все системы инженерной инфраструктуры. Ремонт и обслуживание систем осуществляется в соответствии с рекомендациями производителей. Осуществляется плановая замена оборудования по всем системам в соответствии с рекомендациями производителей и текущим состоянием. Построен и функционирует процесс управления жизненным циклом систем. Осуществляется управление эффективностью обслуживания на основании мониторинга текущего технического состояния систем и отдельных единиц оборудования. Качество реализации процессов обслуживания и их полнота подтверждены независимой сертификацией.

 Обеспечивающие процессы. Осуществляется полномасштабный контроль качества реализации всех эксплуатационных процессов. Своевременно планируются мощностные потребности по критичным системам. Осуществляется планирование и прогнозирование загрузки площадей ЦОД.

РЕСУРСЫ

– Персонал. Наличие квалифицированного персонала по всем системам в достаточном количестве. Достаточный уровень квалификации для устранения аварий и обслуживания систем собственными силами и/или путем привлечения заранее согласованных ресурсов внешних подрядчиков. Осуществляется поддержание квалификации персонала путем регулярного обучения всех сотрудников исполнению процедур обслуживания, регламентов и инструкций. Подготовка и развитие персонала осуществляется планомерно, в рамках единой программы, с учетом текущих и перспективных потребностей, действующих и перспективных технологий. Осуществляется планирование и подготовка кадрового резерва. Квалификация персонала и достаточность его численности подтверждены независимой сертификацией объекта.

 Технологии и инструменты. Обеспечение ЗИП осуществляется в полном объеме в соответствии с требованиями и рекомендациями производителей систем и оборудования. Существует и эффективно функционирует электронная система доступа к документации по оборудованию, включая описание конфигураций, порядка обслуживания и иных регламентных и типовых процедур. Построена и функционирует единая централизованная система управления обслуживанием, реализующая функционал следующих автоматизированных систем:

• мониторинг параметров систем и оборудования;

• управление системами и оборудованием;

• управление инцидентами;

• управление проблемами;

• управление обслуживанием;

• учет оборудования и систем, их текущего состояния и иных эксплуатационных параметров.

Внедрена и используется в повседневной деятельности электронная база данных, обеспечивающая ведение и доступ к нормативной и иной документации по инженерным системам, исполняемым процессам и процедурам и др. Анализ текущего и перспективного состояния инженерных систем ЦОД осуществляется с применением системы моделирования.

– Информация. Имеется и в любое время доступна персоналу эксплуатации документация по всем системам и оборудованию.

– Финансы. Финансирование осуществляется в необходимых объемах в форме выделенного бюджета на эксплуатацию ЦОД, с учетом текущих и перспективных задач и потребностей.

Обслуживание данного типа (по состоянию отрасли на текущий момент) – некоторый идеальный, эталонный вариант, учитывающий в том числе и перспективные задачи и потребности. Недостатков, как и полагается идеалу, у этого типа нет.

ЦОД воспринимается руководством как важный и критичный элемент функционирования компании в настоящее время и на перспективу. Подход обеспечивает абсолютные гарантии надежности функционирования и доступности инженерной инфраструктуры ЦОД с учетом нынешних и будущих потребностей.

IV. ЗАКЛЮЧЕНИЕ: ЧТО ДАЛЬШЕ?

Представленная в статье классификация существующих подходов к эксплуатации инженерной инфраструктуры ЦОД – всего лишь первая попытка авторов осмыслить достижения отечественной эксплуатационной мысли. Безусловно, классификация получилась недостаточно четкой и в ряде элементов – чрезмерно субъективной.

Так, при общении с рядом специалистов отрасли относительно содержания уже подготовленной к публикации статьи были получены замечания по недостаточной детализации и излишнему огрублению требований к элементам при отнесении к тому или иному типу. Особенно это касается типов C и D, к кото­рым в совокупности относится от 40 до 50 % существующих ЦОД. Это вполне справедливое замечание.

Проблема, на наш взгляд, связана со слишком большим разбросом требований между этими типами и типом B. Одновременно ситуация усложняется нелинейным переходом между типами: по факту отнесение к типу С по ряду параметров не означает выполнения требований типа D.

Вероятно, наилучшим выходом будет формирование в будущем промежуточных типов между типами B, С и D. В любом случае мы продолжаем работу над своей классификацией в направлении разработки четких и подсчитываемых критериев, которые позволят с достаточной степенью точности, адекватности и объективности определять принадлежность эксплуатационных подходов к тому или иному типу, предложенному в классификации.

Мы будем признательны экспертному сообществу за все замечания и предложения, которые могли бы послужить делу совершенствования классификации подходов к эксплуатации инженерной инфраструктуры дата-центров.

Также в ближайшем будущем авторы планируют дополнить опубликованную классификацию практическим приложением – описанием возможных стратегий развития для всех типов подходов к эксплуатации, являющихся частью классификации.

Заурбек Алехин,
Дмитрий Басистый,
независимые консультанты

 

КОММЕНТАРИИ ЭКСПЕРТОВ

Антон Платонов, генеральный директор ЦОД «StoreData»

В целом классификация подходов к эксплуатации ЦОД получилась понятной. И это даже хорошо, что появился подобный продукт. Он сможет стать неким ориентиром в море вопросов технического обслуживания инженерной инфраструктуры ЦОД.

Вместе с тем в классификации проглядывается определенный парадокс. С одной стороны, она несколько субъективна, учитывая «открытый океан» несформированной теории обслуживания инженерных систем ЦОД в России. С другой стороны, классификация все-таки общая и недостаточно конкретная, поэтому несколько боязно применять ее к ЦОДам, если учитывать различные уровни прогнозируемой надежности инфраструктуры.

Мне представляется, что зависимость уровня надежности инженерной инфраструктуры ЦОД и уровня эксплуатации все-таки имеет место. К сожалению, я этого не обнаружил в представленной классификации.

Следующий момент: принадлежность ЦОД к определенному формату – ком­мерческому или корпоративно­му. Под­ходы к обслуживанию этих двух основных классов ЦОД весьма и весьма различны. Например, корпоративный дата-центр зачастую имеет одну или даже более резервных площадок (мы все знаем таких флагманов отрасли), и поэтому «падение» резервной площадки не является критичным событием.

В таком случае, как мне представляется, на ее обслуживании можно очень прилично сэкономить. Для эксплуатации таких резервных площадок вполне будет достаточно двух человек, которые в экстренных случаях могут вызвать сотрудников сервисной организации. Стоит подумать над тем, чтобы учесть в будущих версиях классификации и таких представителей ЦОД.

В обслуживании коммерческого ЦОД также полно нюансов и секретов. Как я вижу, практически все владельцы коммерческих ЦОД экономят или пытаются сэкономить на эксплуатации. Не будет большим секретом для моих коллег то, что разовая кратковременная остановка ЦОД экономически куда более выгодна по сравнению с полным и правильным во всех отношениях укомплектованием службы эксплуатации. Для примера: присутствие в ночной смене не просто одного или двух дежурных, а целой команды  смены специалистов (кондиционерщик, электрик, слаботочник) является фантастической роскошью и расточительством. Мне известны всего несколько коммерческих ЦОД в Москве, которые могут себе это позволить.

Ко всему вышесказанному можно еще добавить, что вряд ли финансисты коммерческого ЦОД позволят заложить в бюджет крупные траты на модернизацию инфраструктуры – например, замену аккумуляторных батарей, двигателя ДГУ или устаревших кондиционеров. В лучшем случае будет позволено закупить ЗИП ограниченного перечня и будет выделен «сиротский» бюджет на ремонт инженерных систем. Средний срок жизни ЦОД составляет около 10 лет. В связи с этим не столь коротким сроком концепция «авось протянем» очень популярна. Чтобы приблизить, приземлить классификацию в будущих версиях, стоит более детально продумать ее экономические элементы.

Игорь Дорофеев, генеральный директор компании iCord

Вопросы формализации и постановки эксплуатационных процедур в российском сегменте рынка ЦОД в последнее время становятся все более актуальными. Этому, безусловно, способствует реализация крупных проектов ЦОД, управление которыми с точки зрения здравого смысла уже не представляется возможным. Значительные средства, затраченные на создание инфраструктуры ЦОД, должны быть подкреплены соответствующим по качеству обслуживанием на этапе эксплуатации.

Целесообразность внедрения того или иного типа, в том числе простых вариантов, определяется задачами, стоящими перед ЦОД, выбранными характеристиками и требованиями по доступности. Все это опирается на соразмерную экономику бизнес-процессов. Возможно, что для большинства ЦОД не нужны затратные типы B или A, для достаточного качества управления вполне хватит типа C и команды специалистов, которые болеют за свое дело.

К сожалению, применительно к реальной ситуации наличие формальных признаков не всегда будет гарантировать ожидаемый уровень. Например, в методике отсутствует параметр качества внедрения самих процедур, и затраченные усилия могут быть сведены на нет пассивностью и безответственностью персонала или липовыми документами. Это, безусловно, является вопросом для дальнейшей проработки. Тем не менее, первичная задача классификации и формализации подходов авторами статьи выполнена в полной мере. Методика помогает определиться с текущей ситуацией, вспомнить о рисках и показать, куда можно двигаться, если возникнет желание что-то улучшить.

Целесообразность затрат и усилий на достижение того или иного уровня зрелости подхода к эксплуатации лежит в зоне ответственности собственника ЦОД. Представляется, что данная классификация должна вызвать интерес в первую очередь крупных коммерческих и корпоративных дата-центров. Апробация методики позволит найти слабые места, выровнять существующие процедуры по качеству реализации и в конечном счете повысить надежность и оптимизировать затраты на операционную деятельность ЦОД. При дальнейшем развитии и формализации методов оценки эксплуатационных процедур описанный подход может быть доступен для широкого внедрения.

Андрей Павлов, генеральный директор компании «Датадом»

Авторы абсолютно справедливо указали в заключении своей работы, что их классификация не может на данном этапе ее развития быть панацеей для определения уровня эксплуатационного совершенства дата-центра. В первую очередь это связано, на мой взгляд, с тем, что типы ЦОД, определенные в классификации, являются агрегатными по некоторому набору характеристик объекта (элементов базовой модели), но разнообразие этих наборов может быть существенно больше, чем шесть типов, предложенные авторами.

Думаю, что многие реальные ЦОД, скорее всего, не попадут ни в один из типов представленной классификации и будут «болтаться» где-то посередине между двумя, а то и большим количеством предложенных типов. Но не это главное.

Главное в том, что неоспоримой заслугой авторов является их желание популяризовать тему построения операционных моделей эксплуатации ЦОД, которой, как было справедливо замечено, у нас уделяется пока недостаточно внимания, и особенно – формализации процесса эксплуатации с точки зрения управления.

Также весьма полезной может оказаться разработанная авторами декомпозиция параметров эксплуатации ЦОД на элементы базовой модели. Она послужит существенным подспорьем тем компаниям, которые захотят оптимизировать собственную операционную модель эксплуатации. Для первичной оценки качества и полноты существующего подхода к эксплуатации ЦОД им достаточно будет оценить хотя бы наличие или отсутствие того или иного элемента модели, а по возможности и качественный уровень каждого элемента. Данная оценка сразу может выявить слабые и сильные стороны существующей операционной модели и дать пищу для размышления руководству компании – оператора ЦОД, желающему что-то изменить к лучшему.

Мне кажется, данная работа послужит первым шагом к разработке серьезного и эффективного инструмента, который позволит методично выявлять и исправлять ошибки и недочеты, имеющиеся в существующих службах эксплуатации ЦОД, а также разрабатывать и создавать операционные модели эксплуатации дата-центров, отталкиваясь от потребностей бизнеса и требуемого уровня надежности работы объекта.

 

ССЫЛКИ И ИСТОЧНИКИ

[1] Operating Model [Электронный ресурс] / Wikipedia. The Free Encyclopedia / Wikipedia Foundation. – [Б.м.], [2001–]. – Режим доступа: http://en.wikipedia.org/wiki/Operating_model. – Загл. с экрана. – Яз. англ.

[2] Davenport, Thomas H., Short, James E. The New Industrial Engineering: Information Technology and Business Process Redesign [Электронный ресурс] / Thomas H. Davenport , James E. Short // Sloan Management Review. – 1990. – Vol. 31. – No. 4. – Режим доступа: http://www.archive.org/details/newindustrialeng00dave. – Загл. с экрана. – Яз. англ.

[3] Hammer, Michael, Champy, Jim. Reengineering the Corporation: A Manifesto for Business Revolution [Текст] / Michal Hammer, Jim Champy. – [Б.м]: Nicholas Brealey Publishing, 2001. – 256 с. – Изд. 3-е, испр.

[4] Johnson, Mark W., Christensen, Clayton M. and Kagermann, Henning. Reinventing Your Business Model [Текст] / Mark W. Johnson и др. // Harvard Business Review. – 2008. – Дек. – Яз. англ.

[5] Official ITIL® Website [Электронный ресурс] / APM Group Ltd. – [Б.м.], [2007–]. – Режим доступа: http://www.itil-officialsite.com. – Загл. с экрана. – Яз. англ.

[6] COBIT 5: A Business Framework for the Governance and Management of Enterprise IT [Электронный ресурс] / ISACA . – [Б.м.], [Б.г.]. – Режим доступа: http://www.isaca.org/cobit/pages/default.aspx. – Загл. с экрана. – Яз. англ.

[7] Business Process Framework (eTOM) [Электронный ресурс] / TeleManagement Forum. – [Б.м.], [1998–]. – Режим доступа: http://www.tmforum.org/BusinessProcessFramework/1647/home.html. – Загл. с экрана. – Яз. англ.

[8] Woolley, Bob, Hagan, Mike. Tiered Infrastructure Maintenance Standards (TIMS) for Mission-Critical Environments Sustainability [Электронный ресурс] / Bob Woolley, Mike Hagan / Lee Technologies. – [Б.м.], [Б.г.]. – Режим доступа: http://www.leetechnologies.com/index.php/resources-and-insights/whitepapers-tims. – Загл. с экрана. – Яз. англ.

[9] Data Center Site Infrastructure Tier Standard: Operational Sustainability [Электронный ресурс] / Uptime Institute LLC. – N.Y., 2013. – Режим доступа: http://www.uptimeinstitute.com/publications. – Яз. англ.

[10] Data Center Maturity Model (DCMM) [Электронный ресурс] / Dan Azevedo, David Ibarra, Rona Newmark, Steve O’Donnell, Zeydy Ortiz, John Pflueger, Nik Simpson, Victor Smith и др. / The Green Grid Association – [Б.м.], [Б.г.]. – Режим доступа: http://www.thegreengrid.org/en/Global/Content/white-papers/DataCenterMaturityModel. – Загл. с экрана. – Яз. англ.

[11] Capability Maturity Model Integration [Электронный ресурс] / CMMI Institute – [Б.м.], [Б.г.]. – Режим доступа: http://cmmiinstitute.com/. – Загл. с экрана. – Яз. англ.

Источник: журнал ЦОДы.РФ, август 2013, № 04

Теги: Классификация, Заурбек Алехин, Дмитрий Басистый, Эксплуатация

Чтобы оставить свой отзыв, вам необходимо авторизоваться или зарегистрироваться

Комментариев: 0

Регистрация
Каталог ЦОД | Инженерия ЦОД | Клиентам ЦОД | Новости рынка ЦОД | Вендоры | Контакты | О проекте | Реклама
©2013-2024 гг. «AllDC.ru - Новости рынка ЦОД, материала по инженерным системам дата-центра(ЦОД), каталог ЦОД России, услуги collocation, dedicated, VPS»
Политика обработки данных | Пользовательское соглашение