Продолжаем тему оптимизации. Давайте немного поговорим про железо, CEM (клиентский опыт) и QoS (качество сервиса), SLA (соглашение об уровне сервиса), или Fault Management (в общем управление техническими проблемами), ну и много других. В общем сегодня я бы хотел коснуться темы выхода из строя оборудования с одной стороны, либо как экономить на плановых проверках оборудования и какие кейсы оптимизации могут возникать вокруг этих вопросов.
Первый кейс — это прогнозирование выхода из строя оборудования, иногда прогнозируют еще срок дожития оборудования, чтобы встраивать мероприятия по проактивной закупке, доставке оборудования или внеплановом обслуживании. Если есть показатели датчиков и есть корреляция между показателями и выходом из строя оборудования, то конечно такие задачи решаются классическими методами Data Mining (используются 3 класса алгоритмов — классификация для прогнозирования наступления событий, последовательность для выделения паттерна поведения, прогнозирование — для уточнения периода наступления событий), либо если паттерн более четкий с понятной сезонностью (что скорее будет поводом понять почему событие периодически повторяется с заданным интервалом) — то можно обойтись и методами прогнозирования временных рядов. Когда оборудование стоит дешево, задача простая, когда оборудование стоит очень дорого, то задача более комплексная, так как метрики эффективности немного другие, например, как минимизировать простой или когда необходимо инициировать закупку и поставку оборудования или обеспечить резервное оборудование для горячей замены. Иногда сложность задачи заключается в отсутствии какой-либо информации, но не стоит опускать руки, можно начать с простых данных, обогащая их данными планового осмотра оборудования, главное это делать систематически. Также в ход должны обязательно идти все показатели, которые использовались, при детальном разборе инцидентов, если таковые случались. Также предельные уровни заданы в технической документации к оборудованию, их также можно использовать за основу. Иногда необходимо само преобразование показателей с оборудования с помощью специальных устройств.
2. Как экономить на плановых проверках или замене устаревшей инфраструктуры. Сразу хочу сказать, это не панацея от всех бед, но в условиях дефицита бюджета такой подход имеет право на жизнь. Каждый производитель конечно заявляет регламентный срок жизни и рекомендует проводить какие-то профилактические осмотры оборудования, иногда оказывает техническую поддержку. Указывается как правило некий предельный уровень утилизации оборудования и срок жизни. Если вы понимаете, что утилизируете оборудования намного меньше указанных уровней, то конечно вы можете продлить срок жизни оборудования. Можно это сделать, закрыв глаза и махнув рукой, авось итак сойдет, а можно подойти к этому по умному, настроив мониторинг показателей и задав определенные уровни контроля и нотификаций для оперативного реагирования на возможные инциденты. Такой подход позволит увеличить срок жизни, провести проверку только когда есть к этому предпосылки, а когда оборудование работает в штатном режиме — увеличить временной интервал плановых проверок, что позволит экономить деньги на этих работах. При этом конечно можно и просто машине отдать право принимать решения, получив сразу значимую экономию, однако я за поэтапный переход, потому как многие из событий могут быть выловлены на тех данных, что вы не собираете или только при визуальном осмотре. В зависимости от сложности оборудования конечно можно и визуальный осмотр заместить камерой + алгоритмом, уже доказано, что многие подходы к решению задач машинного зрения намного лучше человека выделяют значимые изменения между двумя картинками, и тут нам тоже есть что предложить.
В общем, есть чем поделиться в части реализации подобных кейсов. Кому интересно, добро пожаловать в ЛС.

Удачи и будьте более эффективны!