Сегодня я хочу поделиться своим опытом внедрения методологии сегментации на предприятии.

Как Вы помните, я рассказывал, что работал в одной из крупнейших телекоммуникационных компаний в России руководителем группы аналитиков и кому как не моей группе пришлось решать задачу сегментации клиентской базы.

Сегодня я Вам попытаюсь вкратце рассказать, через что пришлось пройти при разработке методологии.

Был изучен мировой опыт

Тут конечно очень много подходов от самой продвинутой на мой взгляд сегментации по потребности клиента, до самой простой напрашивающейся в любом случае исторической ценности клиента.

Что послужило предпосылками к внедрению методологии сегментации?

Желание сократить расходы. Дорогие каналы продаж и обслуживания высокодоходным, дешевые низкодоходным.

Направленное продуктовое предложение на разные сегменты не на уровне цены, а именно на уровне подхода к созданию продукта исходя из структуры потребления услуг связи и ряда других характеристик.

Что было результатом работы?

Результатом работы должна была стать методология сегментации, которая должна была быть положена в основу продуктовой политики, системы взаимоотношений с клиентами и биллинговыми системами. Т.е. методология, которая должна была заставить компанию начать жить совершенно по-новому. За этим следовала большая программа трансформации продаж и обслуживания.

Технические средства, которые использовались.

В работе мы использовали доступные на тот момент нам MS Office (Access, Excel) + SPSS.

Трудности, с которыми нам пришлось столкнуться.

Первая самая большая проблема, с который мы столкнулись, это наличие нескольких биллингов в различных региональных филиалах. Часть данных находились в предбиллинагах. Чтобы свести всё это многообразие информации и привести к единому виду нам пришлось долго и упорно все это дело сводить в Access, так как объем данным был настолько велик, что Excel с его ограничением в 1 млн. записей просто отдыхает.

Если бы у нас стояла задача просто разделить клиентов, то наверное на этом этапе мы бы перешли к анализу  информации в Access. Но необходимо, чтобы биллинги стали понимать к какому сегменту относится каждый из клиентов, поэтому совместно с блоком IT при поддержке подразделения продаж нам необходимо было срочно проводить выравнивание биллингов. Что и было сделано.

Теперь самое интересный и творческий этап. Как разделить абонентов. В результате долгого и кропотливого анализа в Excel + Access + SPSS задача была решена.

Отдельно был разработан подход для юр. лиц, который заключался в том, что помимо главной характеристики исторической ценности клиента, были выделены характеристики, которые влияют на структуру потребления услуг связи (географический охват, структура потребления услуг (традиционные, новые)).

База физических лиц также была поделена по исторической ценности. Отдельно была выделена структурная характеристика, которую позже назвали потенциал роста. Т.е. базу низкодоходных физических лиц разбили на тех, кто склонен к росту и тех, кто имеет структуру потребления, которая с высокой долей вероятности не склонна к росту.

Для простоты был применен классический метод k-средних. Использовали мы биллинговые начисления, очищенные от перерасчетов, поэтому наличие выбросов было исключено. Также для исключения фактора сезонности мы брали годовые данные по начислениям.

Применение динамических алгоритмов кластерного анализа, как Вы помните, не очень подходит для решения нашей задачи, так как все-таки задача состояла не в разработке продукта, а в том, чтобы определить верхне-уровневые сегменты.

Кроме этого, мы применили довольно высокий коэффициент сэмплирования (порядка 90-95%), так как некоторые данные по абонентам на наш взгляд вызывали большое подозрение. В 5-10% попала та абонентская база, которая пользовалась услугами меньше года и могла значительно «зашумить»  границы кластеров.

Конечно, можно было бы применить и намного меньший коэффициент, при этом границы сегментов изменялись бы в пределах погрешности. Позже мы проверили данную гипотезу, отклонения по границам в пределах 2-3%. Что навело на мысль, что все-таки наши границы довольно устойчивы. Но сразу мы не решились на этот эксперимент, потому что была гипотеза несколько иная, что структура абонентской базы от филиала к филиалу отличается, тарифы отличаются, что могло привести к некорректному выбору границ сегментов, например исключить один из сегментов в одном из филиалов или другие не очень хорошие последствия. Но к счастью она не подтвердилась.

На этом моя работа над данным проектом была выполнена. Период работы составлял порядка 3-х месяцев. Сама работа по анализу данных и написание методологии не больше 2-х недель. Вот поэтому мы позже и подошли к внедрению BI-системы. Но это уже совсем другая история.

Надеюсь кому-то мой опыт будет полезен. Если у Вас есть какие-то конкретные вопросы присылайте, я на них обязательно отвечу.

Желаю удачи в работе!