Практика прогнозирования

Как создать рекомендательный движок для VOD

0

Сегодня немного поговорим об интересном опыте, который мы прошли создавая рекомендательный движок для продвижения VOD (Видео по запросу). Один из операторов проводил конкурс среди поставщиков подобных решений и мы с командой единомышленников решили сделать такой сервис с нуля самостоятельно. Мы изучили конкурентов на рынке и нашли для себя хорошую нишу, чем мы можем отличаться. Я выступал в качестве эксперта по моделированию и прекрасно понимал предметную область.

Многие решения используют, как правило, алгоритм колоборативной фильтрации для формирования рекомендации. Но у него есть значительный недостаток в виде проседания при холодном старте. Т.е. если статистики телесмотрения очень мало, то рекомендации не будут в себе содержать фильмов, которые не разу не смотрели, иногда срок жизни в библиотеке достаточно мал, чтобы окупиться за время нахождения в библиотеке, поэтому его очень важно активно продвигать через интерфейс приставки.

Помимо поисковых рекомендаций, мы каждую единицу контента описали множеством тегов. Теперь даже не имея статистики смотрения мы можем показывать Далее >

Серия кейсов по аналитике – как из ничего получить что-то (кейс 3)

0

Кейс 3. Как увеличить эффективность кол-центра, оставаясь при том же объеме ресурсов и ФОТ.

Анализируя результаты работы исходящего телемаркетинга, заметил некоторые детали, а именно:

1. Не все операторы одинаково эффективны

2. Не все базы одинаково эффективны

3. Не все скрипты одинаково эффективны

4. Не на все оферы одинаково реагируют

Иногда показатели эффективности отличались в несколько раз. Поэтому, для чистоты экспертимента потратили немного времени на изучение ситуации и тестирование баз, скриптов, оферов. Все результаты сводились в общую таблицу. Задача была выбрать наиболее эффективные базы и наиболее эффективные скрипты и подобрать лучшие оферы. Для этого применяли самый простой метод AB-тестирования. Т.е. меняли один из параметров, остальные оставались прежними, чтобы набрать некоторую статистику для принятия решения об изменениях и составления карты здоровья.

Также в результате прослушивания, удалось понять, что наиболее эффективные телемаркетологи отходят от скриптов, имея собственные заготовки. Наиболее эффективных также попросили внести изменения в скрипты, чтобы проверить гипотезу.

Провели тестирование, замерили Далее >

Какая точность считается нормальной?

0

Каждый раз когда речь заходит о моделировании, мне очень часто приходится слышать вопрос – как вы считаете, какая точность является нормальной. И я всегда не могу на него ответить однозначно, назвав какую-то величину.  В моем блоге достаточно примеров, когда точность важна, когда я писал про моделирование потребления электроэнергии, когда каждый закупленный в пустую киловатт может пропасть, а не закупленный может не принести желанной прибыли, но мог быть реализован. В то же время бывают другие ситуации, когда точность прогноза не столь важна, особенно если для достижения точности приходится значительно усложнять модель, которая в конечном итоге плохо интерпретируется, а иногда и вовсе становится неустойчивой на более длительных отрезках времени.

Попробуем на примерах показать, что есть хорошо, а что есть плохо.

Пример 1

Модель на тестовой выборке показывает 60%. Я бы не советовал брать такую модель. Это очень низкий показатель, близкий по сути к угадыванию, которая Далее >

Особенности сезонности

0

Хотел бы сегодня поговорить об особенности применения моделей сезонной декомпозиции.

Думаю все, кто так или иначе занимался прогнозированием, сталкивались с сезонной составляющей и вероятнее всего ее применяли. Но вероятно не многие задумывались о том, что за сезонностью могут скрываться абсолютно другие причины.

Всегда ли нужно применять модель сезонной декомпозиции, когда вам кажется что есть сезонная составляющая и я вам даже больше скажу бывают ситуации, когда и математические модели говорят о наличии сезонной составляющей, но после получение такого прогноза, факт может быть абсолютно другим и не всегда соответствующим тренду.

Давайте попробуем разобраться в каких ситуациях это происходит. Для универсальности и упрощения выявления факторов, я бы порекомендовал использовать классификацию CRTconnection(единовременные платежи), rent (регулярные платежи, основанные на ежемесячной фиксированной плате за месяц), traffic (платежи за конкретно потребляемый объем услуг).

С точки зрения Connection – тут все просто, как правило зависимость от изменения Далее >

Русские идут (Прогноз или Prognoz)

0

Недавно познакомился с очень интересным решением от компании Прогноз. Решение разработано в Перми и история компании очень напоминает историю компании SAS. Решение российского разработчика очень интересно, потому что аккумулируют в себя действительно многие модные фичи. Компания уделяет большое внимание визуалу и функциям управления. Имеет очень симпатичный мобильный клиент. Конечно, буду справедлив и воздержусь о том, чтобы называть эту платформу BI-платформой. Скорее я бы сравнивал его с многими решениями, построенными на базе OLAP. В этом классе решений я бы их особо выделил.

Компания ставит себе действительно амбициозные задачи по превращению себя в глобального мегавендора, и стоит отметить, что попасть в квадрат Гартнера наверное дорогого стоит. Да и спецы Гартнера пока скорее относят эту платформу к нишевым решениям.

Очень хочется надеяться, что компания не затеряется на фоне лидеров.  Посмотрим на динамику в следующем году.

С точки зрения ценовой политики у них все Далее >

Вверх