Запуск услуги «Мониторинг»

На работоспособность современного веб-сервиса влияют самые разнообразные факторы. В условиях постоянного роста количества данных и увеличения числа пользователей инфраструктура сервиса усложняется, и остро встает проблема отслеживания ее состояния. Имеющиеся средства мониторинга (например, Nagios или Icinga) во многих случаях оказываются недостаточными.

Одновременно с ростом инфраструктуры требуется обеспечивать масштабируемость системы мониторинга: количество проверок все время растет, отчеты становятся все более объемными… Отслеживание стабильности работы веб-сервиса в таких условиях отнимает все больше времени и средств.

Прекрасно понимая всю сложность описываемой ситуации, мы разработали услугу мониторинга сервисов для своих клиентов. Подробное её описание представлено ниже.

Что такое мониторинг?

Мониторинг — это услуга, позволяющая проверять различные сервисы на доступность из нескольких точек в Интернете и отправляющая уведомления в случае выполнения или невыполнения заданного условия. Мы постарались сделать услугу мониторинга максимально гибкой, чтобы ей могли воспользоваться и те, кто не имеет навыка администрирования веб-сервисов.

Доступные типы проверок

В настоящее время доступны следующие типы проверок:

  • PING – проверка наличия связи с сервером, помогает измерить задержку и доступность от точки проверки до сервера;
  • TCP – проверка состояния TCP-порта;
  • UDP — проверка состояния UDP-порта;
  • SSH — проверка подключения без авторизации, а также проверка баннера SSH;
  • SMTP, POP3, IMAP — проверка работоспособности почтового сервиса по выбранному протоколу;
  • DNS — проверка правильности преобразования доменного имени в IP-адрес на указанном резолвере;
  • HTTP GET — проверка содержимого и кода ответа, а также поиск подстроки в возвращенных данных;
  • HTTP HEAD — облегченный запрос GET, позволяющий проверять наличие документа на сервере по коду ответа без необходимости загружать всё тело документа;
  • HTTP базовая авторизация — проверка механизма базовой авторизации;
  • HTTP digest — проверка механизма дайджест-авторизации;
  • FTP — проверка достуности FTP-сервера;
  • PostgreSQL — проверка доступности сервера баз данных PostgreSQL;
  • MySQL – проверка доступности сервера баз данных MySQL;
  • SSL — проверка срока действия SSL-сертификатов для доменных имен.

Точки присутствия

На данный момент точки проверки расположены в следующих городах: Москва, Санкт-Петербург, Екатеринбург, Киев, Амстердам, Франкфурт, Лондон, Нью-Йорк, Пало-Альто. Если на вашем сервере установлен фаервол, то при создании проверки вы можете получить IP-адреса точек присутствия, чтобы включить их в правила фаервола.

Создание проверки

В настоящее время сервис мониторинга работает в тестовом режиме. Каждый пользователь может создать только три проверки. Войдите в панель управления под своей учетной записью. В основном меню выберите пункт «Мониторинг». Откроется следующая страница:

Мониторинг

Нажмите на кнопку «Создать». В выпадающем меню выберите тип проверки:

Выбор типа проверки

Затем введите параметры проверки:

Параметры проверки

Все параметры проверок подразделяются на обязательные (общие для всех типов проверок) и индивидуальные (характерные для проверок определенного типа; они отображаются в разделе «Остальные параметры».

К обязательным параметрам относятся:

  • период проверки — периодичность, с которой будет осуществляться проверка;
  • таймаут проверки — промежуток времени, по истечении которого проверка будет считаться неуспешной;
  • последовательность выполнения проверок — порядок, в соответствии с которым будет осуществляться проверка из выбранных точек присутствия (последовательно, параллельно или же в случайном порядке);
  • хост/IP — доменное имя или IP-адрес проверяемого сервера;
  • протокол — приоритет протокола, по которому будет осуществляться проверка (IPv4 или IPv6).

Для каждого типа проверки могут также быть установлены индивидуальные параметры:

  • Для проверок SSH:
    • порт для подключения;
    • баннер;
  • Для проверок TCP:
    • отсылаемая строка;
    • строка ответа;
  • Для проверок UDP:
    • порт для подключения;
    • отсылаемая строка;
    • строка ответа;
  • Для проверок SMTP:
    • пользователь;
    • пароль;
    • безопасный режим (включен/выключен);
    • баннер;
    • домен;
  • Для проверок POP3 и IMAP:
    • пользователь;
    • пароль;
    • безопасный режим (включен/выключен);
    • start_tls;
    • баннер;
    • домен;
  • Для проверок HTTP GET:
    • порт для подключения;
    • user agent;
    • реферер;
  • Для проверок HTTP HEAD:
    • порт для подключения;
    • подстрока;
    • user agent;
    • реферер;
    • Для проверок HTTP Базовая авторизация и HTTP Digest авторизация;
    • порт для подключения;
    • пользователь;
    • пароль;
  • Для проверок FTP:
    • порт для подключения;
    • режим (активный или пассивный);
    • анонимный (включить/отключить);
    • пользователь;
    • пароль;
  • Для проверок PostreSQL и MySQL:
    • порт для подключения;
    • пользователь;
    • пароль;
  • Для проверок SSL:
    • порт для подключения;
    • период для проверки.

Заполнив основные и индивидуальные поля, укажите точки присутствия, из которых будет осуществляться проверка.
После этого нажмите на кнопку «Создать». Далее нужно указать условия, при которых вам будет отправляться удоведомление о результатах проверки. По завершении создания проверки на экране появится следующее окно:

Проверка создана

Затем нажмите на кнопку «Создать условия для созданной проверки». Откроется форма добавления условия:

Форма добавления условия

В качестве условий могут быть заданы:

  • успешное или неуспешное завершение процедуры проверки;
  • ошибка подключения;
  • время ответа (оно может быть равно или не равно, больше или равно, меньше или равно указанного пользователем).

Для каждого типа проверки могут также быть установлены индивидуальные условия. Уведомления о результатах проверки, отправляемые при заданных условиях, содержат дополнительную информацию, с помощью которой можно выявить проблемные участки во время проведения проверок.

Просмотр информации о проверках

Список добавленных проверок отображается на вкладке «Проверки»:

Список добавленных проверок

Справа от имени каждой проверки расположены кнопки управления:
icon-1 — добавление проверки в избранное;
icon-2 — тестирование проверки;
icon-3 — просмотр и редактирование параметров проверки;
icon-4 — удаление проверки.

Если нажать на любую проверку в списке, откроется карточка с детальной информацией:

Детальная информация

Она включает следующие вкладки:

  • «Информация» (название, хост, тип, дата создания, SLA, сведения о последних проверках);
  • «Графики» (графики доступности и время задержки; на основе сопоставления графиков можно определить, в чем заключается причина задержек: в неисправности сети или в работе сервиса);
  • «История» (список последних проверок с указанием времени, точки доступа, времени ответа и результата);
  • «Статистику» (сведения об отправленных уведомлениях);
  • «Настройка» (форма для просмотра и редактирования параметров проверки);
  • «Условия» (сведения об условиях, установленных для выбранной проверки).

Проверки, добавленные в избранное, показываются также в списке на вкладке «Информация»:

Вкладка «Информация»

На вкладке “Информация” также отображаются сведения о пяти последних выполненных условиях, пяти последних выполненных проверках и о пяти последних совершенных вами действиях.

Детальная информация о результатах всех проверок можно ознакомиться на вкладке «История».
Полная история всех ваших действий показана на вкладке «Действия».

Рассылка уведомлений

Уведомления рассылаются:

  • по e-mail;
  • мгновенными сообщениями по протоколу xmpp;
  • приватными сообщениями в твиттере (DM) — в этом случае клиенту нужно будет подписаться на наш аккаунт, с которого осуществляется рассылка.

После запуска услуги в коммерческую эксплуатацию планируется рассылка уведомлений SMS-сообщениями.

Планы на будущее

Как уже было сказано выше, сервис мониторинга сейчас функционирует в тестовом режиме. В ближайшем будущем мы планируем расширение существующей функциональности. Так, сейчас проходит тестирование функция «публичная статистика» — доступная всем страница с данными по доступности выбранных проверок. Наши клиенты смогут прикрепить ее к отдельному домену, чтобы предоставлять статистику доступности своим пользователям.

В ближайшее время появится возможность периодической рассылки сводной статистики по электронной почте. Появятся и новые типы проверок.

Приглашаем всех наших читателей протестировать услугу мониторинга. Мы будем очень признательны за любые замечания, пожелания и предложения.

Что еще почитать по теме

T-Rex 30 марта 2021

Что такое SMTP-протокол и как он устроен?

SMTP (Simple Mail Transfer Protocol) — протокол передачи почты. Он был представлен еще в 1982 году, но не теряет актуальности до сих пор. В статье разбираемся, какие задачи решает протокол и как он ра…
T-Rex 30 марта 2021
Владимир Туров 1 сентября 2020

Дело совершенно секретного iPod

Это был обычный серый день в конце 2005 года. Я сидел на рабочем месте и писал код для следующей версии iPod. Вдруг без стука ворвался директор ПО для iPod, начальник моего начальника, и закрыл дверь.
Владимир Туров 1 сентября 2020
T-Rex 21 августа 2020

TrendForce: цены на SSD упадут

Эксперты DRAMeXchange предсказывают значительное падение цен на оперативную память и твердотельные накопители в ближайшее время. Причина — сокращение спроса на чипы для NAND и DRAM.
T-Rex 21 августа 2020

Новое в блоге

Михаил Фомин 24 июня 2022

Docker Swarm VS Kubernetes — как бизнес выбирает оркестраторы

Рассказываем, для каких задач бизнесу больше подойдет Docker Swarm, а когда следует выбрать Kubernetes.
Михаил Фомин 24 июня 2022
Ульяна Малышева 30 сентября 2022

«Нулевой» локальный диск. Как мы запустили облако только с сетевыми дисками и приручили Ceph

Чем хороши сетевые диски и почему именно Ceph, рассказал директор по развитию ядра облачной платформы Иван Романько.
Ульяна Малышева 30 сентября 2022
Валентин Тимофеев 30 сентября 2022

Как проходит онбординг сотрудников ИТО? Что нужно, чтобы выйти на смену в дата-центр

Рассказываем, как обучаем новых сотрудников, какие задачи и испытания проходят инженеры прежде, чем выйти на свою первую смену.
Валентин Тимофеев 30 сентября 2022
T-Rex 28 сентября 2022

Книги по SQL: что почитать новичкам и специалистам

Собрали 6 книг, которые помогут на старте изучения SQL и при углублении в тему.
T-Rex 28 сентября 2022