Система мониторинга и управления автопарком для «Группы ГАЗ»

КЛИЕНТ

1
производственных предприятий
0
все автомобили ГАЗ подключены к GAZ Connect

«Группа ГАЗ» – российская автомобилестроительная компания, специализирующаяся на разработке и производстве легких коммерческих автомобилей, среднетонажных грузовиков, автобусов, силовых агрегатов и автокомпонетов. Компания имеет 13 производственных предприятий в 8 регионах России, а также сбытовые и сервисные организации.

ЗАДАЧИ

В течение 2-3 лет ГАЗ планирует подключить к платформе GAZ Connect 200 тыс. автомобилей, которые генерируют более 40 тыс. сообщений в секунду. Объем ежемесячной телеметрии, поступающей в систему 200 тыс. автомобилей, составляет более 80 Тбайт. Платформа GAZ Connect должна предоставлять пользователям возможность гибко влиять на все параметры и оптимизировать их с целью получения дополнительного экономического эффекта.

Перед специалистами «Рексофт» была поставлена амбициозная задача модернизировать архитектуру существующей Системы с целью обеспечения высокой отказоустойчивости и производительности, обеспечивающей обработку 40 тыс. сообщений в секунду. Важным требованием являлось отсутствие в Системе единой точки отказа и концентрации нагрузки и обеспечения возможности масштабирования Системы свыше указанной нагрузки без ее доработок.

РЕШЕНИЕ

Компания «Рексофт» на основе самых современных технологий разработала высокопроизводительную систему сбора и обработки данных от транспортных средств, подключенных к платформе GAZ Connect, включающую в себя подсистему управления бортовыми телематическими устройствами, установленными на автомобилях ГАЗ.

В ходе выполнения работ была кардинально переработана архитектура прикладной части Системы, устранены зависимости между прикладными сервисами, переработан состав прикладных сервисов, включены новые системные компоненты, способствующие повышению производительности. Кроме того, «Рексофт» существенно оптимизировал инфраструктуру частного облака, в котором эксплуатируется Система в части эффективного управления вычислительными ресурсами и обеспечения отказоустойчивости. Компания «Рексофт» помогает заказчику в эксплуатации системы и осуществляет ее техническую поддержку.

Система эксплуатируется в частном облаке, построенном на основе системы управления виртуализацией PureApplication System. Она обеспечивает размещение и переразмещение виртуальных ресурсов на физических серверах, динамическое выделение вычислительных ресурсов в зависимости от нагрузки на виртуальные ресурсы, эвакуацию виртуальных ресурсов на доступные работоспособные физические ресурсы в случае сбоя или отказа оборудования. Также PureApplication System обеспечивает возможность мониторинга состояния и нагрузки на физические и виртуальные ресурсы.

Прикладная часть Системы построена на основе микросервисной архитектуры. Прикладные сервисы функционируют в кластере RedHat OpenShift, дополнительно включающем в себя такие компоненты Service Mesh, как Istio и Kiali.

Кластер OpenShift обеспечивает автоматическое масштабирование прикладных сервисов в зависимости от изменения на них нагрузки, эффективную балансировку нагрузки между экземплярами прикладных сервисов, автоматическое восстановление их работоспособности в случае сбоев. Kiali визуализирует диаграмму взаимодействия между сервисами с указанием временных характеристик по всем запросам, обеспечивая возможность мониторинга состояния и параметров сервисной сети и заблаговременного выявления потенциальных рисков снижения производительности или отказа сервисов.

Первичный прием данных от бортовых телематических устройств, а также отправку команд на устройства, находящиеся в онлайн режиме, осуществляет высокопроизводительный MQTT брокер IBM MessageSight. Он производит аутентификацию бортового устройства в LDAP при его подключении, получение и буферизацию данных, поступающих от бортовых устройств. Полученные из MQTT брокера сообщения обогащаются дополнительной информацией, обрабатываются прикладными сервисами и сохраняются в телематической базе данных. В процессе обработки сообщения могут быть отправлены внешним потребителям (сервис-провайдерам) в соответствии с их подпиской на данные от заданных автомобилей.

Особое внимание при модернизации Системы было уделено вопросам мониторинга и превентивного выявления рисков, связанных со снижением производительности Системы и отказов ее компонентов. Для решения данной задачи были внедрены подсистемы мониторинга, журналирования и аудита.

Подсистема мониторинга собирает тысячи показателей, характеризующих состояние всех элементов системы. В основе подсистемы мониторинга лежит продукт с открытым кодом Prometheus, который обеспечивает централизованный мониторинг оборудования, уровня виртуализации, системы контейнеризации, мониторинг сетевых интерфейсов, трафика, состояния баз данных и прикладных сервисов. Для каждого показателя установлены пороговые значения, позволяющие Prometheus оперативно уведомлять администраторов о потенциальных рисках и аномалиях в работе системы. Подсистема мониторинга отражает текущее состояние каждого компонента на дашбордах в реальном времени и дает возможность гибкой настройки пороговых значений мониторинга через интерфейс-системы.

Подсистема журналирования и аудита обеспечивает сбор и хранение журнала операций, выполняемых системой, и действий пользователей. Подсистема предоставляет средства визуализации и анализа журнала операций, а также обеспечивает возможность глубокого анализа состояния сервисов системы и событий безопасности с целью ее дальнейшей оптимизации или решения проблем.

Отдельной задачей, необходимой при эксплуатации систем обработки больших данных, является разработка процессов управления данными. При разработке процессов управления данными за основу взята референсная модель DAMA-DMBoK.

Основными прорабатываемыми направлениями являются:

  • Data Governance в части организационно-ролевой модели, политик, положений и регламентов в области управления данными
  • Архитектура данных
  • Хранение, архивирование и удаление устаревших данных
  • Обеспечение качества данных

Преимущества системы

  • Высокая отказоустойчивость
  • Высокая производительность
  • Автоматическое масштабирование сервисов в зависимости от нагрузки

Преимущества внедрения системы

Разработанная система позволяет повысить эффективность использования ресурсов и снизить затраты на эксплуатацию.
За 1,5 года использования критических ошибок и сбоев в работе системы выявлено не было. Время простоя системы за данный период эксплуатации составило менее 2 часа.

В данный момент компания «Рексофт» осуществляет техническую поддержку и оказывает помощь в решении всех технических вопросов, возникающих в процессе эксплуатации системы.

ТЕХНОЛОГИИ

  • PureApplication System
  • RedHat OpenShift
  • IBM MessageSight – MQTT брокер
  • IBM Cloudant
  • PostgreSQL
  • Kafka
  • Redis
  • Prometheus
  • EFK
  • Java/Spring

УСЛУГИ

  • Разработка
  • Тестирование
  • Интеграция
  • Техническая поддержка