Data Mining

Интернет-магазины — горе-советчики.

2

Сегодня, я бы хотел поговорить о системе рекомендаций, реализованных в некоторых Интернет-магазинах. Если Вы еще не понимаете о чем я, тогда давайте приведу простой пример. Например, зашли Вы в описание некоего товара, внизу маленький ползунок с иконками товаров с надписью: «C этим товаром покупают также». И если Вы думаете, что цель этой подсказки в том, чтобы Вам посоветовать что-то полезное, то в большинстве случаев Вы ошибаетесь. Есть, конечно, исключения,и я считаю эти исключения, действительно правильным маркетингом, то есть в первую очередь все исходит из потребности клиента, а во вторую из материальной выгоды для фирмы.

Зайти, например, на сайт KupiVIP, набирающий в последнее время популярность. Моя жена выбирает, например, кольца. А ей рекомендации, с этим товаром покупают также, Вы не поверите, те же самые кольца немного с другим дизайном и такая же надпись «Покупают также». Ок, я согласен, что многие женщины могут брать не одно кольцо, а сразу 2, если это дешевая бижутерия. Но если это кольцо стоит огромных денег? Может лучше рекомендовать другие аксессуары с подобным дизайном? А на самом деле оно происходит так: жена сначала заходит в кольца, ей рекомендуют другие кольца. Потом она заходит в серьги и говорит мне, а помнишь я колечко смотрела, к ним даже сережки есть. Только от момента одного события, до второго прошло минут 10-15. Она уже может и забыть, что колечко смотрела именно с этим дизайном.

Или другой пример, wikimart. Тут еще лучше. Захожу смотреть на жесткий диск, а мне внизу рекомендация «Помимо жесткого диска на Викимарте можно купить стиральные машины — модель такая-то, плита- модель такая-то, варочная поверхность — модель такая-то. Я понимаю, что компании важно заработать деньги, но мне-то нужен жесткий диск. Что Вы можете узнать обо мне, если я ищу жесткий диск. Правильно, у меня как минимум есть компьютер. предложите мне лучше аксессуары на компьютер. Зачем мне стиральная машина, которая стоит в 5 раз больше товара, который меня интересует?

То есть то, в какой товарной категории я нахожусь на сайте, вообще никак не анализируется. Но зато советы раздаются с целью заработать денег. Ну неужели не понятно, что это не будет работать.

Есть другой положительный опыт. Покупал зеркальный фотоаппарат. Мне с магазине естественно предложили чехол, светофильтр, бленду, карту памяти и т.д. Увеличили чек на 20% (А это около 5 тыс. руб., неплохо за 2 минуты разговора со мной?).

Хочу заметить, мне не предлагали купить еще один зеркальный фотоаппарат, не предлагали обратить внимание на холодильники, мне предложили именно те аксессуары, в которых я больше всего нуждался. Пожалел ли я что стал жертвой маркетинга, ни капельки. Я сэкономил время. Вернусь ли я в этот магазин второй раз и буду ли я рекомендовать его своим друзьям и знакомым — непременно. Если Ваша задача продать один раз, то это вопрос цены, если ваша задача еще увеличить частоту покупок и лояльность клиента, это уже несколько шире задача. Ваш клиент должен быть доволен даже несмотря на то, что он заплатил больше.

Поэтому господа аналитики, продумывайте свои сценарии коммуникации с клиентом заранее. Ну не работают Ваши сценарии с теми товарами, в которых не нуждаются клиенты. Варьируйте коммуникацию. Пробуйте другие варианты — например, «возможно Вы заинтересуетесь в этой модели или в этой модели из той же категории». Понятно товары могут быть с большей маржой для интернет-магазина, но они должны также сулить выгоду для клиента. Например, иметь лучшее качество.  Если Вы своим клиентам пытаетесь впарить какой-то товар без разъяснения почему он лучше, это никогда не сработает. В интернет-магазинах это можно также с легкостью реализовать.

Я уже даже привел пару примеров той коммуникации, которая была бы интересна. И поверьте мне, я не исключение. Вы должны ставить клиента на первое место, т.е. быть клиентоориентированными, а вот дальше уж делайте акценты на своих внутренних приоритетах (большую маржу получайте от такой-то марки, лучше предложить более дорогой товар и т.д.).

Но не все так плохо. Есть, например, в рунете исключение в виде Ozon-а.  Варьируется сама коммуникация. Они и рекомендуют что-то купить и показывают на основе статистики просмотров, тот товар который просматривают вместе с основным товаром наибольшее количество раз. Конечно, немного смазалось впечатление, что мне вместе с баскетбольным мячом порекомендовали обратить внимание на электронные сигареты с уровнем поддержки 6%. Ну да ладно, спишем на то, что компания за здоровый образ жизни)).

Конечно, странно, что построение аналитики с нуля на ozon-е и на wikimart приписал себе один и тот же человек. Ну видимо, еще не хватило времени на то, чтобы привести все в порядок на wikimart-e.

Ну что же, будем надеяться, что когда-нибудь и wikimart будет нам рекомендовать правильные вещи.

Если Вы задумываетесь над системой рекомендаций, но не знаете с чего начать и как это лучше реализовать, свяжитесь со мной, возможно, я смогу быть Вам полезным.

Удачи Вам!


Cognos 10 + SPSS

0

Вчера удалось попасть к IBM на презентацию аналитического решения. IBM уделили внимание двум продуктам это Cognos, который из себя представляет BI решение и купленный ими в 2009 году SPSS Clementine.

Почему в названии поста я поставил именно цифру 10, все потому что в этой версии произошла значительная интеграция этих продуктов в единое решение. Теперь любая аналитика, разработанная в BI, может передаться для анализа в SPSS и наоборот. Все это бесшовно.

SPSS имеет довольно дружелюбный интерфейс по отношению к пользователю, все интуитивно понятно.

Если сравнивать 2 продукта, Oracle BI и Cognos, то я бы выделил несколько преимуществ IBM перед Oracle:

1. Возможность подгружать файлы Excel без соответствующего «танца с бубном» на стороне IT в виде заведения отдельной таблички или витрины данных и включение ее в общую модель данных. Только после этого данные из Excel можно обрабатывать в Oracle BI. Надеюсь в будущем Oracle обратит внимание на этот факт.

2. Возможность создавать новые пользовательские уровни иерархии не только на основе значений измерений, но и самих показателей. Причем все это гораздо проще, чем в Oracle.

3. Наличие встроенного статистического пакета, хоть и не расширенного как в SPSS Statistics, но все же простейшие вещи позволяет делать. В BI от Oracle, этого нет.

Конечно, теперь я от IBM услышал о том, что они имеют самое лучшее BI решение в мире, хотя несколько месяцев до этого слышал это от Oracle.

Ну что же, в споре рождается истина. Будем ждать ответы других вендоров. Что скажут теперь SAP, который практически остался без SPSS (кто не знает, ранее SAP его использовал в качестве аналитической части) или SAS, положение в России которого в последнее время пошатнулось из-за неоднозначной ценовой политики.  Может им также стоит задуматься о диверсификации бизнеса и укрепиться на ряде отстающих направлений. В одном есть уверенность, что от этого выиграет бизнес.

Удачи Вам в выборе аналитического инструмента!


Типы закономерностей, выявляемых методами Data Mining

2

Что такое Data Mining мы с Вами разобрались. Сегодня мы поговорим о закономерностях, которые лежат в основе алгоритмов Data Mining-а.

Выделяют пять стандартных типов закономерностей, которые позволяют выявлять  методы Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование. Давайте попробуем разобраться как они применимы на практике.

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 70% купивших творог берут также и сметану, а при наличии скидки от одного производителя такую пару продуктов покупают в 80% случаев . Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки квартиры в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил. Например, может определяться надежность клиента банка по ряду критериев.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных. Как правило, на основе кластеризации формируются новые продукты.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается построить шаблоны, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

В настоящее время в России очень мало коммерческих организаций применяют данные принципы на практике. Лишь некоторые крупные организации могут себе это позволить ну и зря. Применяя алгоритмы Data Mining-а можно значительно увеличить объем реализации продукции, практически не затрачивая дополнительных средств на продвижение.

Успехов в применении!


Data Mining и народные приметы

0

Для более глубоко понимания как же применять Data Mining в прогнозировании, давайте проведем простую параллель между народными приметами и методами Data Mining. Удивительно, но народные приметы это такой же способ прогнозирования, но мы об этом не задумываемся.
Народные приметы создавались на основе постоянных наблюдений, но за явлениями природы. И если раньше, события фиксировались лишь в головах, то сейчас мы тоже самое делаем с помощью применения IT технологий.

«Ласточки летают близко к земле, быть дождю». Люди заметили, что после того, как ласточки низко летали над землей, шел дождь. Т.е. одно событие являлось следствием другого события, т.е. любая народная примета это ничто иное как применение методов Data Maning-а на основе корреляционного анализа.

А теперь Вы уважаемые читатели подумайте, как Ваши данные связаны между собой?

Вот Вам для примера несколько взаимосвязанных процессов — сбой поставок и объемы продаж, открытие регионального филиала и объем продаж. Это то, что может лежать на поверхности и если Вы анализируете внутренние факторы, но Вы же можете этим не ограничиться. Вы работаете в ритейле и узнали о том, что в районе Вашего магазина выключена вода, продажи бутилированной воды могут пойти вверх. Не забудьте позаботится о своих складских запасах.

Также и Вы можете анализировать свои данные и находить в них такие же закономерности и использовать при построении прогнозов. Удачи в работе!


Data Mining

0

Давайте разберемся что такое Data Mining и как его можно применять при прогнозировании.
Корпоративная база данных любого современного предприятия обычно содержит набор данных, хранящих записи о тех или иных фактах либо объектах (например, о товарах, их продажах, клиентах, счетах).
Как правило, каждая запись в подобной таблице описывает какой-то конкретный объект или факт. Например, запись в таблице продаж отражает тот факт, что такой-то товар продан такому-то клиенту тогда-то таким-то менеджером, и по большому счету ничего, кроме этих сведений, не содержит. Однако совокупность большого количества таких записей, накопленных за несколько лет, может стать источником дополнительной, гораздо более ценной информации, которую нельзя получить на основе одной конкретной записи, а именно — сведений о закономерностях, тенденциях или взаимозависимостях между какими-либо данными.
Примерами подобной информации являются сведения о том, как зависят продажи определенного товара от дня недели, времени суток или времени года, какие категории покупателей чаще всего приобретают тот или иной товар, какая часть покупателей одного конкретного товара приобретает другой конкретный товар, какая категория клиентов чаще всего вовремя не отдает предоставленный кредит.
Применение методов Data Mining-а очень полезно в прогнозировании. О том, какие это методы и секреты их применения Вы можете узнать на страницах моего блога.
Удачи в работе!


Вверх