Data Mining

Экономим на моделировании с KNIME

0

Сегодня хотел бы познакомить читателей с одним из инструментов для Data mining.

Все уже наверное, кто так или иначе знаком с Data mining слышали про R, возможно, что многие уже успели даже поработать. Несмотря на богатое многообразие поддерживаемых методов, все-таки среда разработки достаточно специфическая, особенно для людей, далеких от программирования.

Речь пойдет про KNIME (http://www.knime.com) – это open sourse платформа для data driven инноваций (в том числе и методами data mining), которая в отличие от R, обладая достаточно богатым функционалом, имеет еще графический интерфейс.

Я бы сказал, что интерфейс этот ничем не уступает тому же SPSS.

И самое главное преимущество, это все полностью бесплатно. Конечно, если вы хотите поддержку, серверное решение, то придется немного заплатить, но все равно это деньги не соизмеримо меньшие, чем аналогичное решение у других вендоров.

Дистрибутив можно скачать с официального сайта. Там же есть раздел с демо-примерами, видеолекциями. Достаточно просто устанавливается. Честно скажу, глубоко не Далее >

Почему не работает предиктивная аналитика?

0

Построили модель? Модель показывает хорошее качество на цифрах, почему же результаты тестовых кампаний не впечатляют или выигрыш по сравнению с обычными методами оказывается нулевым?

Во-первых, вы должны понимать цель проводимых мероприятий и ее нужно формулировать достаточно четко, не размыто, вида «снизить отток», а вполне конкретно, «уменьшение показателей оттока в целевой группе с 500 до 450 через 2 месяца после начала мероприятий».

Во-вторых, нужно понимать, какие каналы коммуникации вы используете и какова их эффективность. Также важно понимать, сможете вы влиять на эффективность канала или нет.

В-третьих, если в процесс вовлечен персонал, достаточно ли он мотивирован для того, чтобы использовать новый инструмент. Одно дело если вы  пытаетесь модель встроить в достаточно отлаженный бизнес-процесс и все четко понимают, что является результатом на каждом шаге и как потом результаты отражаются на благосостоянии персонала. Другое дело, если вы запускаете какой-либо сложный процесс, которому еще предстоит научиться, тут придется достаточно хорошо поработать над выстраиванием процесса Далее >

Teradata Forum 2013 (Терадата форум)

0

Лучше поздно, чем никогда, вновь удалось побывать на самом интересном на мой взгляд форуме в России от компании Teradata. Компания не только не опустила планку, но даже на мой взгляд ее немного подняла. Приглашенные спикеры как всегда добавили интереса. И наконец кейсы Big Data начались наполняться каким-то смыслом.

Мне больше всего понравилось выступления представителя компании LinkedIn, который рассказал как они на основе анкет создают сервисы как для самих пользователей, так и для B2B-клиентов. На мой взгляд это универсальный алгоритм монетизации BigData. Вероятно, они шли от обратного, т.е. сначала накапливали множество анкет, а потом уже делали интересные сервисы и каждый такой сервис представлен в соц. сети в виде виджета. Удивительно, как можно много сделать интересных сервисов, используя анкетные данные и связи.

Это кладезь информации для исследователей.

Интересны были также выступления российских телеком. компаний, конечно они достаточно сдержанно в отличие от своих коллег по рынку делятся информацией, но все же было Далее >

Русские идут (Прогноз или Prognoz)

0

Недавно познакомился с очень интересным решением от компании Прогноз. Решение разработано в Перми и история компании очень напоминает историю компании SAS. Решение российского разработчика очень интересно, потому что аккумулируют в себя действительно многие модные фичи. Компания уделяет большое внимание визуалу и функциям управления. Имеет очень симпатичный мобильный клиент. Конечно, буду справедлив и воздержусь о том, чтобы называть эту платформу BI-платформой. Скорее я бы сравнивал его с многими решениями, построенными на базе OLAP. В этом классе решений я бы их особо выделил.

Компания ставит себе действительно амбициозные задачи по превращению себя в глобального мегавендора, и стоит отметить, что попасть в квадрат Гартнера наверное дорогого стоит. Да и спецы Гартнера пока скорее относят эту платформу к нишевым решениям.

Очень хочется надеяться, что компания не затеряется на фоне лидеров.  Посмотрим на динамику в следующем году.

С точки зрения ценовой политики у них все Далее >

Что Data mining может, а чего нет?

0

Недавно натолкнулся на очень интересное интервью с Питером Фэйдером (Peter Fader) с редактором журнала CIO Insight Алланом Алтером (Allan Alter), мастером по количественным ислледованиям в маркетинге бизнес-школы Wharton, который обращается к IT-директорам компаний: «хватит накапливать множество абонентских данных и не правильно применять алгоритмы Data mining-а».

Несмотря на то, что интервью бралось еще в далеком 2007 году, мне оно кажется очень актуальным, тем более после появления новых трендов, таких как Big Data. Я уже ни раз говорил о том, что не всегда продвинутый инструментарий позволяет получить гораздо лучшие результаты при аналитической обработке данных, чем при построении простейших моделей в том же Excel. После прочтения этого интервью я еще больше укрепился в этом мнении.

Статья на столько понравилась, что решил сделать перевод для читателей блога.

CIO INSIGHT: Питер, расскажите о сильных и слабых сторонах использования инструментария Data Mining и Business Intelligence.

FADER: 

Инструментарий Далее >

Вверх