Сегодня мне бы хотелось поговорить о еще одном модном тренде в аналитике, а именно Предиктивной аналитике (Predictive analytics). Для начала давайте разберемся с определением.

Предиктивная или прогностическая аналитика (Predictive analytics) — это прежде всего множество методов статистики, анализа данных и теории игр, которые используются для анализа текущих и исторических данных/событий для прогноза данных/событий в будущем.

Наиболее известный способ использования прогностической аналитики — это применение скоринговых моделей для оценки платежеспособности клиента при выдаче кредитов в банке. Это из области «как не наступить на те же грабли», любая скоринговая модель строится на исторических данных, и если в прошлом, какая-либо группа клиентов была уличена в несвоевременном гашении кредитов, а Вы по каким-либо характеристикам схожи с этой группой, то скорее всего в выдаче кредитов Вам откажут.

Однако это не все области, где применяется предиктивная аналитика, ее можно применять для разработки продуктов, для выбора потенциальной аудитории, для выбора следующего продукта, который Вы можете предложить клиенту (Next Best Offer) и множестве других.

Когда говорят о предиктивной аналитике часто сводят разговоры к применению методов Data mining, я бы даже сказал, что это небольшая ветвь Data mining-а, в основе которой лежат некоторые методы Data mining-а.

Центральной сущностью предиктивной аналитики является задача определение предиктора или нескольких предикторов (параметров или сущностей, которые влияют на прогнозируемое событие). Например, страховые компании выделяю такие предикторы, как возраст, стаж вождения при определении страховой премии.

Множество этих предикторов образует модель предиктивной аналитики, которая предсказывает определенное событие в будущем с какой-то степенью вероятности. Чем проще модель (или меньше количество факторов), тем меньше степень точности модели. Но всегда помним, что любая модель строится на произошедших событиях в прошлом и это не значит, что события в будущем могут повториться при тех же параметрах внутренней среды. Соответственно любой процесс моделирования имеет вероятностный характер. Усложняя модель на исторических данных, мы рискуем ее сильно переучить и соответственно, она может перестать быть устойчивой в будущем.

Если Вы еще не применяете предиктивную аналитику, присмотритесь к этой области, она позволяет значительно увеличить эффективность Вашего бизнеса.

Удачи Вам!

Еще о Data mining, прогнозировании.