Data Mining

Cognos 10 + SPSS

0

Вчера удалось попасть к IBM на презентацию аналитического решения. IBM уделили внимание двум продуктам это Cognos, который из себя представляет BI решение и купленный ими в 2009 году SPSS Clementine.

Почему в названии поста я поставил именно цифру 10, все потому что в этой версии произошла значительная интеграция этих продуктов в единое решение. Теперь любая аналитика, разработанная в BI, может передаться для анализа в SPSS и наоборот. Все это бесшовно.

SPSS имеет довольно дружелюбный интерфейс по отношению к пользователю, все интуитивно понятно.

Если сравнивать 2 продукта, Oracle BI и Cognos, то я бы выделил несколько преимуществ IBM перед Oracle:

1. Возможность подгружать файлы Excel без соответствующего «танца с бубном» на стороне IT в виде заведения отдельной таблички или витрины данных и включение ее в общую модель данных. Только после этого данные из Excel можно обрабатывать в Oracle BI. Надеюсь в будущем Далее >

Типы закономерностей, выявляемых методами Data Mining

2

Что такое Data Mining мы с Вами разобрались. Сегодня мы поговорим о закономерностях, которые лежат в основе алгоритмов Data Mining-а.

Выделяют пять стандартных типов закономерностей, которые позволяют выявлять  методы Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование. Давайте попробуем разобраться как они применимы на практике.

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 70% купивших творог берут также и сметану, а при наличии скидки от одного производителя такую пару продуктов покупают в 80% случаев . Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки квартиры в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются Далее >

Data Mining и народные приметы

0

Для более глубоко понимания как же применять Data Mining в прогнозировании, давайте проведем простую параллель между народными приметами и методами Data Mining. Удивительно, но народные приметы это такой же способ прогнозирования, но мы об этом не задумываемся. Народные приметы создавались на основе постоянных наблюдений, но за явлениями природы. И если раньше, события фиксировались лишь в головах, то сейчас мы тоже самое делаем с помощью применения IT технологий.

«Ласточки летают близко к земле, быть дождю». Люди заметили, что после того, как ласточки низко летали над землей, шел дождь. Т.е. одно событие являлось следствием другого события, т.е. любая народная примета это ничто иное как применение методов Data Maning-а на основе корреляционного анализа.

А теперь Вы уважаемые читатели подумайте, как Ваши данные связаны между собой?

Вот Вам для примера несколько взаимосвязанных процессов – сбой поставок и объемы продаж, открытие регионального филиала и объем продаж. Это то, Далее >

Data Mining

0

Давайте разберемся что такое Data Mining и как его можно применять при прогнозировании. Корпоративная база данных любого современного предприятия обычно содержит набор данных, хранящих записи о тех или иных фактах либо объектах (например, о товарах, их продажах, клиентах, счетах). Как правило, каждая запись в подобной таблице описывает какой-то конкретный объект или факт. Например, запись в таблице продаж отражает тот факт, что такой-то товар продан такому-то клиенту тогда-то таким-то менеджером, и по большому счету ничего, кроме этих сведений, не содержит. Однако совокупность большого количества таких записей, накопленных за несколько лет, может стать источником дополнительной, гораздо более ценной информации, которую нельзя получить на основе одной конкретной записи, а именно — сведений о закономерностях, тенденциях или взаимозависимостях между какими-либо данными. Примерами подобной информации являются сведения о том, как зависят продажи определенного товара от дня недели, времени суток или времени года, какие категории покупателей чаще всего приобретают тот или иной товар, какая часть Далее >

Вверх