Записи с меткой Прогнозирование

Что такое предиктивная аналитика? (Predictive analytics)

0

Сегодня мне бы хотелось поговорить о еще одном модном тренде в аналитике, а именно Предиктивной аналитике (Predictive analytics). Для начала давайте разберемся с определением.

Предиктивная или прогностическая аналитика (Predictive analytics) — это прежде всего множество методов статистики, анализа данных и теории игр, которые используются для анализа текущих и исторических данных/событий для прогноза данных/событий в будущем.

Наиболее известный способ использования прогностической аналитики — это применение скоринговых моделей для оценки платежеспособности клиента при выдаче кредитов в банке. Это из области «как не наступить на те же грабли», любая скоринговая модель строится на исторических данных, и если в прошлом, какая-либо группа клиентов была уличена в несвоевременном гашении кредитов, а Вы по каким-либо характеристикам схожи с этой группой, то скорее всего в выдаче кредитов Вам откажут.

Однако это не все области, где применяется предиктивная аналитика, ее можно применять для разработки продуктов, для выбора потенциальной аудитории, для выбора следующего продукта, который Вы можете предложить клиенту (Next Best Offer) и множестве других.

Когда говорят о предиктивной аналитике часто сводят разговоры к применению методов Data mining, я бы даже сказал, что это небольшая ветвь Data mining-а, в основе которой лежат некоторые методы Data mining-а.

Центральной сущностью предиктивной аналитики является задача определение предиктора или нескольких предикторов (параметров или сущностей, которые влияют на прогнозируемое событие). Например, страховые компании выделяю такие предикторы, как возраст, стаж вождения при определении страховой премии.

Множество этих предикторов образует модель предиктивной аналитики, которая предсказывает определенное событие в будущем с какой-то степенью вероятности. Чем проще модель (или меньше количество факторов), тем меньше степень точности модели. Но всегда помним, что любая модель строится на произошедших событиях в прошлом и это не значит, что события в будущем могут повториться при тех же параметрах внутренней среды. Соответственно любой процесс моделирования имеет вероятностный характер. Усложняя модель на исторических данных, мы рискуем ее сильно переучить и соответственно, она может перестать быть устойчивой в будущем.

Если Вы еще не применяете предиктивную аналитику, присмотритесь к этой области, она позволяет значительно увеличить эффективность Вашего бизнеса.

Удачи Вам!

Еще о Data mining, прогнозировании.


Сертификация прогнозистов

0

На Западе стало модным получать различные сертификаты, подтверждающие некую квалификацию. На этом отстраиваются огромные бизнесы. Сертификаты на знание ПО, подтверждающие знание какого-либо языка давно прижились и в России. Чего не скажешь о сертификации прогнозистов. Есть различные тренинговые компании, которые проводят обучения методам прогнозирования, но сказать, что существует некий стандарт в России, значит ничего не сказать. Его попросту не существует. Программы университетов подстраиваются под квалификацию преподавателей. В то же время на Западе существует как минимум 2 сертификата, подтверждающих уровень владения методами прогнозирования.

Организации, которые занимаются сертификацией специалистов:

1. Institute of business forecasting&planning (IBF)

2. International Institute of Forecaters (IIF)

IBF

IBF сертификация является беспроигрышным вариантом для специалиста, гарантирующая его профессионализм в области планирования и прогнозирования.

Что дают компании сертифицированные специалисты:
* Повышение качества планирования спроса и навыков прогнозирования, а также более глубокое понимание компании
* Улучшение бизнес-решений в масштабах предприятия
* Повышение эффективности бизнеса и повышение вашей прибыли
* Повышение доверия к решениям персонала
* Сотрудники, которые обладают сертификатом CPF (Certified Professional Forecaster) компетентны в вопросах планирования и прогнозирования
* И многое другое!

«IBF сертификаты признаны во всем мире как подтверждающие компетенцию в области планирования и прогнозирования. Сертификаты уже давно признаны как знак профессионализма, но не все сертификаты равны. Основанный в 1981 году, институт прогнозирования и планирования бизнеса является признанным и уважаемым во всем мире. Но, не спрашивайте нас, спросите сотни международных компаний, сотрудники которых имеют такие сертификаты.»

По окончании подготовки, специалисты проходят тестирования, после чего получают сертификат CPF (Certified Professional Forecaster).

IIF

На сайте более скромное описание программы, но в то же время требования к подготовке специалистов являются не меньшими.

«Сертификация специалистов по прогнозирование спроса (CPDF — Certification of Demand Forecasters and Planners) является образовательной учебной программой, разработанной в сотрудничестве с IIF для повышения профессионального статуса прогнозистов по оценке спроса и планированию в организации цепочки поставок. Курс обучения состоит из практических занятий, под руководством инструктора семинаров совместно с самостоятельным обучением в режиме онлайн. Сертификация трехуровневая: Базовый (Basic), Мастер (Master) и Профессиональны (Pro).«

На Западе, в отличие от России, давно уже существуют должности прогнозистов. И неотъемлемым требованием к должности является наличие какого-либо сертификата. И если Вы ставите своей целью работать в международной компании, присмотритесь к этим программам, получение сертификата существенно увеличит Ваши шансы на трудоустройство.

Со временем в блоге я выложу материалы, которые могут быть полезны, и опишу методы, которые необходимо знать для получения сертификатов. Следите за обновлением в блоге!

Удачи Вам!


Бесплатный сервис для прогнозирования

2

Сегодня я Вам расскажу об одном сервисе, который построен по модели SaaS, в тестировании которого я принимал непосредственное участие и предложил одну доработку сервиса, которую охотно приняли на вооружение.

Но обо все по порядку. URL ресурса: ForecasterOnline.com. Авторы сервиса — Индусы.

Все, что нужно для начала использования сервиса — это зарегистрироваться. Пока сервис бесплатен для пользователей. На входе вы задаете Excel таблицу с данными, на выходе построенный прогноз и возможность выгрузить прогнозные данные в CSV файл, который также можно просмотреть в Excel.

На сегодняшний момент реализованы следующие модели для прогнозирования:

Линейная регрессия (Single Variable Regression Model)

В качестве модели рассматривается уравнение вида Y=A*X+B, где Y — предсказываемая величина, X — независимая переменная, которая может показывать, например, период. A, B — искомые параметры.

Полиномиальная регрессия 2-ого и 3-его порядка (Single Variable Polynomial Regression Model)

В качестве модели рассматривается уравнение вида Y=A*X^2+B*X+C или Y=A*X^3+B*X^2+C*X+D, где Y — предсказываемая величина, X — независимая переменная, которая может показывать, например, период. A, B, С, D — искомые параметры.

Скользящее среднее (Moving Average Method)

Самый простой из ныне известных методов прогнозирования. В качестве прогноза берется среднее арифметическое за некоторое количество рассматриваемых периодов. По умолчанию берется среднее за 5 периодов. Самый простой прогноз это взять значение предыдущего периода — в литературе Вы можете встретить такое понятие как «Наивная модель». Довольно часто применяется на практике, если необходимо, например, план продаж распределить по устоявшемуся соотношению между точками реализации. В качестве прогноза процента используется предыдущее фактическое значение.

Взвешенное скользящее среднее (Weighted Moving Average Method)

В отличии от предыдущего метода исторические значения взвешиваются по определенным весам. Можно варьировать значимость исторических данных. По умолчанию в качестве модели используется среднее по двум значениям с весами 0,7 и 0,3. Изменяя параметры весов, можно учитывать небольшое влияние исторических данных и больший вес данных, которые произошли в недавнем прошлом.

Экспоненциальное сглаживание (Exponential Smoothing)

Метод очень похож на предыдущий, чем более давнее событие тем меньший вес оно имеет. Чем давность события меньше,тем больше оно учитывается.

Простое экспоненциальное сглаживание (Single Exponential Smoothing)

Модель больше подходит когда данные не показывают какого-либо тренда или сезонности. Данные перед прогнозированием сглаживаются.

Двойное экспоненциальное сглаживание (Double Exponential Smoothing)

Для сглаживания применяется модель Хольта. Подходит для прогнозирования, когда в данных прослеживается линейный тренд без сезонности.

Тройное экспоненциальное сглаживание (Triple Exponential Smoothing)

Модель подходит для прогнозирования данных, в которых прослеживается и тренд и сезонность.

Автоматическое нахождение модели (Best Fit Model) — данная опция была добавлена авторами после моей рекомендации.

Выбирает автоматически модель для прогнозирования исходя из минимума ошибки прогноза и максимума точности модели.

Данная опция подходит для людей не очень разбирающихся в методах прогнозирования, но желающих найти оптимальную модель для прогнозирования. Есть и негативный момент применения данной опции. Иногда лучше взять более устойчивую модель, нежели более точную на исторических данных. Поэтому лучше аккуратно подходить к использованию данной опции и все же протестировать несколько моделей, которые дают хорошие результаты, перед выбором лучшей.

Если у Вас остались вопросы по применению методов, я постараюсь детально освятить методы нахождения и критерии оценки моделей прогнозирования в другой раз.

Ну что же удачи авторам и удачного вам применения сервиса!



Пример сезонной декомпозиции и сглаживания пиков

3

Выкладываю простейшие примеры прогнозов временных рядов а также возможные пути борьбы с пиками.

Модель

А вот здесь уже более реальный пример на живых данных, пример с форума 4p:
Пример с форума 4p

Еще один пример восстановления данных о продажах при дефиците товаров, в примере используется сезонная декомпозиция по неделям. В вот и файл. Пример с форума zakup.vl.ru

IBM некоторые новости и обзор Cognos TM1

0

Вчера был на встрече в IBM, смотрел функционал системы бюджетирования Cognos TM-1, которая также как и Oracle Hyperion Planning, построена на многомерной СУБД.

Какие бы я интересности выделил в этой системе. Система может выступать в качестве реального инструмента аналитика для планирования продаж. Реализован функционал автоматической увеличения показателей по году с учетом сезонности, распределения по подразделениям и товарным категориям. Достаточно встать на итоговую цифру, указать, что она должна увеличиться на столько-то, указать какие периоды не должны меняться, указать какие категории должны участвовать в увеличении и система сама распределит по пропорции данные показатели. Поидее ничего особенно, достаточно также поупражнятся в Excel-е, но у кого несколько тысяч товарных категорий, тот поймет, что если по каждой товарной категории необходимо заложить свою логику, то необходимо взять ряд, перенести его, рассчитать доли, умножить сумму увеличения на каждую из этих долей, после чего добавить к исходному показателю. Достаточно трудоемко, здесь все реализовано много проще.

Доступен как Web-интерфейс, так и Excel, реализована функция write для изменения данных в БД. Можно менять в Excel-е и сохранять изменения на сервере. Кто знаком с BI-системами, тот понимает что там только функция read, поэтому для полноценной аналитики BI-системы не очень-то подходят. Хотя в OHP это тоже есть.

Понятно, что есть базовый статический функционал, свои мини-дешборды, которые реально отображают ключевые показатели, очень удобно визуально, когда количество подразделений большое, проверять на адекватность финансовые показатели, выводя на дешборды, например маржу, динамику выручки и т.д.

В общем у кого есть потребность в реальном инструменте для прогнозирования, анализа финансовых показателей, система в данном случае очень гибка. Но как и все продукты IBM имеет недостаток в виде цены.

Еще одна приятная новость для пользователей SAP. Все-таки SAP и IBM договорились по поводу использования SPSS совместно с решениями SAP в качестве аналитической части. Если бы не договорились, SAP бы значительно ослабил позиции. А так пока еще повисят в лидерах.

Удачи Вам в выборе инструментария!


Вверх
Яндекс.Метрика