Перед тем как описывать обе темы, хотел их освятить отдельно, но немного поразмыслив, все-таки объединил в одну, потому что для целей бизнеса эти 2 понятия неразрывно связаны друг с другом.

Естественно, в бизнесе мы оперируем понятием «Сегментация», мало задумываясь или даже не понимая причем тут кластерный анализ. Вот на эти вопрос я и постараюсь дать ответ в своей статье.

Сегментация — это процесс разделения рынка или абонентов по определенным признакам, например, по половому признаку, по географическому признаку, по поведенческому признаку или любому другому. Очень часто в качестве признаков разделения выбирают не один признак, а сразу несколько. Процесс сегментации применяют, например, для более четкого позиционирования товаров, для дифференциации от конкурентов, для создания новых ниш продуктов и в целом ряде других случаев. На вопрос что дает сегментация для бизнеса, я бы ответил так «Позволяет  увеличить объемы рынка и оптимизировать затратную часть». Даже если Вы работаете на стагнирующем или падающем рынке, проведите сегментацию и вдохните жизнь в Ваш бизнес. Не всегда, конечно, работает, но в большинстве случаев это именно тот инструмент, который Вам нужен. О внедрении сегментации на предприятии я расскажу в другой статье. О том как это можно сделать и что она может дать с конкретными примерами, Вы можете узнать из моего блога. Ну и чтобы не быть голословным, давайте я Вам приведу практический пример, как внедрение сегментации на предприятии помогает расширить границы рынка.

Вот Вам простой пример создания новой ниши. Например, Вы производитель электроники, производите сотовые телефоны и MP3 плееры. Вот видите, Вы уже догадались, что сотовые телефоны с поддержкой MP3 это и есть один из способов расширения границ бизнеса за счет выделения приграничных сегментов.

Теперь другой пример, немногие знают что бренд VERTU принадлежит финской Nokia. VERTU — это дочерняя компания фирмы Nokia, созданная в 1998 году для производства мобильных телефонов класса люкс. Это тоже яркий пример применения сегментации.

А теперь Вы, дорогие читатели подумайте как можно сегментировать Ваш товар для увеличения эффективности Вашего бизнеса? Я с уверенностью могу сказать, что сегментировать можно все товары. Раньше я пытался найти примеры товаров, которые нельзя сегментировать, но к сожалению, а может и к счастью, таких нет. На что только маркетологи не идут, чтобы удовлетворить капризного покупателя.

Ну к вопросу о ценности сегментации на предприятии мы еще вернемся в другой раз, а теперь перейдем к вопросу о  кластерном анализе.

Как я уже сказал выше, сегментация это разделение, так вот именно алгоритмы кластерного анализа позволяют разбивать продукты, рынок, клиентов по определенным признакам.

Выделяют 2 типа алгоритмов кластерного анализа: статические алгоритмы (т.е. с заранее заданным числом кластеров или сегментов) и динамические (такой подход к сегментации, который автоматически рассчитывает число кластеров).

Самый распространенный алгоритм кластерного анализа, который есть, пожалуй, во всех статистических пакетах да и во всех учебниках, это алгоритм «k-средних» (или k-means). На его основе уже придумано множество модификаций, но суть его проста. k — это изначально заданное число кластеров или сегментов. Центрами данных кластеров на первом этапе, Вы можете например считать первые k-наблюдений. Затем каждое следующее наблюдение Вы относите к тому кластеру, расстояние до центра которого у Вас минимально. Затем Вы пересчитываете центры этих кластеров (центр не обязательно будет совпадать с одним из Ваших наблюдений) и опять по всем наблюдениям проводите отнесение к сегменту и так до тех пор, пока центры кластеров не перестанут у Вас изменять значение или изменение значений центров кластеров столь мизерно, что им можно пренебречь.

Стоит упомянуть, что это количественный метод, т.е. расчетный, соответственно перед его применением необходимо все качественные характеристики привести к количественным. Т.е. если в качестве параметра сегментации Вы решили использовать цвет продукции, то все цвета должны быть закодированы числовыми значениями.

Самым главным недостатком метода k-средних является его неустойчивость к «выбросам», т.е. центры кластеров начинают сильно сдвигаться, если данные сильно зашумлены.  Иногда вместо меры «расстояние» используют медианы. Алгоритм менее чувствителен к шумам и выбросам данных, чем алгоритм k-средних, поскольку медиана меньше подвержена влияниям выбросов. В литературе Вы его встретите по названию PAM (partitioning around metoids).

Примером динамического алгоритма может служить метод ISODATA. Алгоритм также итерационный, т.е. Вы также задаете начальное число кластеров, последовательно находите центры кластеров, но при этом в алгоритме заложен механизм разбиения и объединения кластеров. Однако куда Вас заведет алгоритм заранее не известно. Вы лишь можете указать ряд ограничений, который смогут сделать процесс более предсказуемым.

Есть и другие алгоритмы и их модификации.

Если говорить о пользе применения данных алгоритмов, то несомненно для маркетолога более интересны динамические алгоритмы, т.е. когда ты можешь получить нечто непредсказуемое, понять почему ты это получил и после этого применить метод k-средних и выстроить вокруг сегментации полный цикл маркетинга.

Теперь Вы знаете что алгоритмы кластерного анализа применяются для проведения сегментации. О сегментации и о пользе ее применения Вы можете найти информацию на страницах моего блога.