Когда отдельные части не видят целого: почему крупным предприятиям нужен зонтичный мониторинг IT-инфраструктуры

Когда отдельные части не видят целого: почему крупным предприятиям нужен зонтичный мониторинг IT-инфраструктуры

В этой статье мы рассмотрим, почему традиционные инфраструктурные подходы к мониторингу могут оказаться недостаточными для крупных предприятий с распределенной сетью, а также поговорим о преимуществах и принципах работы зонтичного мониторинга.

Современный бизнес, особенно в масштабе крупных распределенных предприятий, зависит от IT: от стабильной работы серверов, облачных платформ, сетевых соединений и внутренних приложений. Но что происходит, когда эта IT-инфраструктура становится слишком большой и сложной? Как отследить ее состояние, предотвратить сбои и обеспечить бесперебойную работу всего бизнеса? Ответ лежит в зонтичном мониторинге IT-инфраструктуры.

Понимание преимуществ использования систем зонтичного мониторинга позволит компаниям не только защитить сеть, но и оптимизировать процессы управления рисками, повысить уровень доверия со стороны клиентов и партнеров, а также обеспечить устойчивое развитие в условиях постоянно меняющегося технологического ландшафта.

Основные подходы к ИТ-мониторингу

На данный момент не существует общепринятой классификации подходов мониторинга, но условно можно выделить два типа: классический инфраструктурный и зонтичный. Разберем ключевые отличия этих подходов.

Инфраструктурный мониторинг Зонтичный мониторинг
Наблюдает за состоянием отдельных компонентов. Наблюдает за здоровьем всей системы, включая ИТ-сервисы и инженерную инфраструктуру, на уровне предприятия и его филиалов.
Измеряет производительность и доступность элементов сети, отслеживая метрики, такие как использование ЦПУ, памяти, дискового пространства, сетевого трафика и т.д. Отслеживает время отклика, доступность, проводит корреляцию событий безопасности и уведомляет о подозрении на инциденты ИБ.  

Особенность инфраструктурного подхода заключается в том, что отслеживается состояние каждого отдельно взятого элемента сети: контроллеров, датчиков, серверов, баз данных, веб-сервисов. У каждого элемента, в свою очередь, есть собственный софт для мониторинга (например, Zabbix, Nagios, Grafana, Prometheus), и за их работоспособность нередко отвечают отдельные сотрудники в IT-подразделении. Это может быть удобным для обеспечения мониторинга и расследования проблем отдельного объекта.

Отсюда вытекают и минусы такого подхода: когда мониторинг проводится в отношении отдельно взятых систем, отсутствует понимание общей картины. К остановке какого бизнес-процесса приведет сбой в конкретном оборудовании, как элементы сети связаны и как влияют друг на друга, откуда именно проистекает инцидент.

Зонтичный мониторинг решает эту проблему, т.к. представляет собой комплексный подход к наблюдению за состоянием сети на всех уровнях:

  • консолидирует данные из всех задействованных систем мониторинга
  • выводит их «в едином окне»
  • устанавливает связь между элементами сети и между филиалами
  • в целом создает комплексный взгляд на ИТ-инфраструктуру.

Пример

В крупном производственном предприятии наблюдаются сбои в АСУП, что приводит к простоям оборудования и снижению производительности. В систему зонтичного мониторинга поступает следующая информация от разных систем:

  • данные о производительности серверов, времени отклика приложений, а также логи ошибок АСУП;
  • данные о состоянии трубопроводов: давление и наличие утечек данные с других датчиков: например, уровень влажности в различных зонах завода.

Корреляция событий в рамках одной системы позволяет быстро установить:

  • сбои в системе управления происходят в моменты, когда фиксируются утечки воды вблизи серверных комнат или критически важных производственных; участков; 
  • в периоды сильных дождей или резкого повышения влажности в воздухе увеличивается количество ошибок в работе систем.

Таким образом, благодаря зонтичному мониторингу и интеграции данных из ИТ- и инженерной инфраструктуры удалось установить, что утечки воды приводят к повышенной влажности и, как следствие, к сбоям в работе серверов и АСУП. Кроме того, данные о нагрузке на серверы показывают, что при увеличении числа пользователей (например, во время планового запуска нового продукта) система начинает работать нестабильно, что усугубляется проблемами с инженерной инфраструктурой.

Точное и оперативное выявление проблемы позволяет разрабатывать комплексные решения, которые улучшают надежность и эффективность всего предприятия.

Какой подход лучше?

Мы не будем категорично заявлять, что одно явно лучше другого – всегда лучше подходить к вопросам обеспечения работоспособности комплексно и обеспечивать мониторинг и отдельных элементов, и системы в целом. Однако считается, что зонтичная система мониторинга – это следующая ступень развития мониторинга инфраструктурного, и если предприятие крупное и части производства географически удалены друг от друга – то зонтичная система будет лучшим выбором.

В случае с UDV ITM решение осуществляет мониторинг сразу на трех уровнях:

Первый (низший) уровень – мониторинг технологических объектов, в том числе удаленных, и обработка данных по их доступности и производительности. Применяется как агентный, так и безагентный метод мониторинга.

Второй уровень – уровень филиала, на котором консолидируются данные со всех подключенных технологических объектов, в том числе осуществляется управление удаленными серверами мониторинга первого уровня.

Третий (верхний) уровень осуществляет зонтичный мониторинг: это уровень централизованного администрирования (supervision) системы в масштабах всей инфраструктуры предприятия и ее элементов.

Сервер мониторинга UDV ITM реализована на базе Zabbix. Это значит, что она легко интегрируется в уже имеющиеся на предприятии системы мониторинга состояния сети и позволяет сразу начать получать данные. Решение включено в Реестр российских программ и БД, сертифицировано ФСТЭК России и является полноценной альтернативой Zabbix.

Когда зонтичный ИТ-мониторинг становится необходимостью?

Предприятия, основанные на сложных ИТ-системах и зависимые от них, остро нуждаются в надежном и комплексном мониторинге. Зонтичная система мониторинга помогает управлять рисками и предотвратить проблемы, которые могут возникнуть в сложных IT-системах. Если ваша компания отвечает хотя бы одной из описанных характеристик, то «зонтик» становится необходимым инструментом для безопасной и бесперебойной работы.

  1. Сложная структура и географическая распределенность. Если у вас много филиалов и разрозненная ИТ-инфраструктура, отслеживать работу всех компонентов становится непросто. Это особенно актуально для производств, где сбои в одном филиале могут привести к серьёзным задержкам, простоям в производственном процессе, потере данных, что влечет за собой не только репутационные риски, но и финансовые потери, риски для бизнеса и снижение качества продукции. 
  2. Многообразие и сложность ИТ-инфраструктуры. Использование «зоопарка» оборудования, баз данных, серверов, дата-центров и облачных решений делает необходимым создать единую систему мониторинга, которая будет отслеживать их взаимодействие, чтобы не пропустить неисправности.
  3. Использование различных инструментов мониторинга. Если каждая команда отслеживает свои компоненты с помощью разных инструментов, то сложно получить полную картину о состоянии всей системы. Зонтичный мониторинг объединяет все эти данные, предоставляя единый интерфейс для аналитики.
  4. Высокая зависимость бизнеса от стабильной работы ИТ. Если сбои в IT-инфраструктуре приводят к значительным финансовым и репутационным потерям (в том числе – на производствах, где нарушение технологического процесса может привести к аварии и жертвам), то зонтичный мониторинг поможет оперативно отслеживать проблемы и предотвратить серьезные последствия.

Что в результате

Результат внедрения зонтичного подхода главным образом выражается в том, что появляется целостное и единообразное понимание распределенной ИТ-системы. Это выражается:

  • в едином окне для управления, наблюдения и реагирования;
  • в автоматизации мониторинга, анализе и управлении в реальном времени;
  • в быстром информировании и определении причин аварий и инцидентов безопасности;
  • в оптимизации и соблюдении SLA; 
  • в оптимизации усилий, затрачиваемых IT-командой.

Чтобы обсудить ваш проект или заказать демонстрацию зонтичного мониторинга UDV ITM, заполните форму на сайте.

Картинка

Ксения Могилева

Менеджер продукта UDV ITM

Ксения отвечает за определение вектора развития системы мониторинга UDV ITM, проводит исследования рынка систем мониторинга, анализ потребностей заказчиков и пользовательского опыта.

ITM 6 минут

другие новости

Изображение.

оставьте заявку

напишите нам,
если у вас есть вопросы

Ответим в рабочие дни с 9:00 до 18:00 по Москве