Современный бизнес, особенно в масштабе крупных распределенных предприятий, зависит от IT: от стабильной работы серверов, облачных платформ, сетевых соединений и внутренних приложений. Но что происходит, когда эта IT-инфраструктура становится слишком большой и сложной? Как отследить ее состояние, предотвратить сбои и обеспечить бесперебойную работу всего бизнеса? Ответ лежит в зонтичном мониторинге IT-инфраструктуры.
Понимание преимуществ использования систем зонтичного мониторинга позволит компаниям не только защитить сеть, но и оптимизировать процессы управления рисками, повысить уровень доверия со стороны клиентов и партнеров, а также обеспечить устойчивое развитие в условиях постоянно меняющегося технологического ландшафта.
Основные подходы к ИТ-мониторингу
На данный момент не существует общепринятой классификации подходов мониторинга, но условно можно выделить два типа: классический инфраструктурный и зонтичный. Разберем ключевые отличия этих подходов.
Инфраструктурный мониторинг | Зонтичный мониторинг |
Наблюдает за состоянием отдельных компонентов. | Наблюдает за здоровьем всей системы, включая ИТ-сервисы и инженерную инфраструктуру, на уровне предприятия и его филиалов. |
Измеряет производительность и доступность элементов сети, отслеживая метрики, такие как использование ЦПУ, памяти, дискового пространства, сетевого трафика и т.д. | Отслеживает время отклика, доступность, проводит корреляцию событий безопасности и уведомляет о подозрении на инциденты ИБ. |
Особенность инфраструктурного подхода заключается в том, что отслеживается состояние каждого отдельно взятого элемента сети: контроллеров, датчиков, серверов, баз данных, веб-сервисов. У каждого элемента, в свою очередь, есть собственный софт для мониторинга (например, Zabbix, Nagios, Grafana, Prometheus), и за их работоспособность нередко отвечают отдельные сотрудники в IT-подразделении. Это может быть удобным для обеспечения мониторинга и расследования проблем отдельного объекта.
Отсюда вытекают и минусы такого подхода: когда мониторинг проводится в отношении отдельно взятых систем, отсутствует понимание общей картины. К остановке какого бизнес-процесса приведет сбой в конкретном оборудовании, как элементы сети связаны и как влияют друг на друга, откуда именно проистекает инцидент.
Зонтичный мониторинг решает эту проблему, т.к. представляет собой комплексный подход к наблюдению за состоянием сети на всех уровнях:
- консолидирует данные из всех задействованных систем мониторинга
- выводит их «в едином окне»
- устанавливает связь между элементами сети и между филиалами
- в целом создает комплексный взгляд на ИТ-инфраструктуру.
Пример
В крупном производственном предприятии наблюдаются сбои в АСУП, что приводит к простоям оборудования и снижению производительности. В систему зонтичного мониторинга поступает следующая информация от разных систем:
- данные о производительности серверов, времени отклика приложений, а также логи ошибок АСУП;
- данные о состоянии трубопроводов: давление и наличие утечек данные с других датчиков: например, уровень влажности в различных зонах завода.
Корреляция событий в рамках одной системы позволяет быстро установить:
- сбои в системе управления происходят в моменты, когда фиксируются утечки воды вблизи серверных комнат или критически важных производственных; участков;
- в периоды сильных дождей или резкого повышения влажности в воздухе увеличивается количество ошибок в работе систем.
Таким образом, благодаря зонтичному мониторингу и интеграции данных из ИТ- и инженерной инфраструктуры удалось установить, что утечки воды приводят к повышенной влажности и, как следствие, к сбоям в работе серверов и АСУП. Кроме того, данные о нагрузке на серверы показывают, что при увеличении числа пользователей (например, во время планового запуска нового продукта) система начинает работать нестабильно, что усугубляется проблемами с инженерной инфраструктурой.
Точное и оперативное выявление проблемы позволяет разрабатывать комплексные решения, которые улучшают надежность и эффективность всего предприятия.
Какой подход лучше?
Мы не будем категорично заявлять, что одно явно лучше другого – всегда лучше подходить к вопросам обеспечения работоспособности комплексно и обеспечивать мониторинг и отдельных элементов, и системы в целом. Однако считается, что зонтичная система мониторинга – это следующая ступень развития мониторинга инфраструктурного, и если предприятие крупное и части производства географически удалены друг от друга – то зонтичная система будет лучшим выбором.
В случае с UDV ITM решение осуществляет мониторинг сразу на трех уровнях:
Первый (низший) уровень – мониторинг технологических объектов, в том числе удаленных, и обработка данных по их доступности и производительности. Применяется как агентный, так и безагентный метод мониторинга.
Второй уровень – уровень филиала, на котором консолидируются данные со всех подключенных технологических объектов, в том числе осуществляется управление удаленными серверами мониторинга первого уровня.
Третий (верхний) уровень осуществляет зонтичный мониторинг: это уровень централизованного администрирования (supervision) системы в масштабах всей инфраструктуры предприятия и ее элементов.
Сервер мониторинга UDV ITM реализована на базе Zabbix. Это значит, что она легко интегрируется в уже имеющиеся на предприятии системы мониторинга состояния сети и позволяет сразу начать получать данные. Решение включено в Реестр российских программ и БД, сертифицировано ФСТЭК России и является полноценной альтернативой Zabbix.
Когда зонтичный ИТ-мониторинг становится необходимостью?
Предприятия, основанные на сложных ИТ-системах и зависимые от них, остро нуждаются в надежном и комплексном мониторинге. Зонтичная система мониторинга помогает управлять рисками и предотвратить проблемы, которые могут возникнуть в сложных IT-системах. Если ваша компания отвечает хотя бы одной из описанных характеристик, то «зонтик» становится необходимым инструментом для безопасной и бесперебойной работы.
- Сложная структура и географическая распределенность. Если у вас много филиалов и разрозненная ИТ-инфраструктура, отслеживать работу всех компонентов становится непросто. Это особенно актуально для производств, где сбои в одном филиале могут привести к серьёзным задержкам, простоям в производственном процессе, потере данных, что влечет за собой не только репутационные риски, но и финансовые потери, риски для бизнеса и снижение качества продукции.
- Многообразие и сложность ИТ-инфраструктуры. Использование «зоопарка» оборудования, баз данных, серверов, дата-центров и облачных решений делает необходимым создать единую систему мониторинга, которая будет отслеживать их взаимодействие, чтобы не пропустить неисправности.
- Использование различных инструментов мониторинга. Если каждая команда отслеживает свои компоненты с помощью разных инструментов, то сложно получить полную картину о состоянии всей системы. Зонтичный мониторинг объединяет все эти данные, предоставляя единый интерфейс для аналитики.
- Высокая зависимость бизнеса от стабильной работы ИТ. Если сбои в IT-инфраструктуре приводят к значительным финансовым и репутационным потерям (в том числе – на производствах, где нарушение технологического процесса может привести к аварии и жертвам), то зонтичный мониторинг поможет оперативно отслеживать проблемы и предотвратить серьезные последствия.
Что в результате
Результат внедрения зонтичного подхода главным образом выражается в том, что появляется целостное и единообразное понимание распределенной ИТ-системы. Это выражается:
- в едином окне для управления, наблюдения и реагирования;
- в автоматизации мониторинга, анализе и управлении в реальном времени;
- в быстром информировании и определении причин аварий и инцидентов безопасности;
- в оптимизации и соблюдении SLA;
- в оптимизации усилий, затрачиваемых IT-командой.
Чтобы обсудить ваш проект или заказать демонстрацию зонтичного мониторинга UDV ITM, заполните форму на сайте.