Data Mining

Типы закономерностей, выявляемых методами Data Mining

2

Что такое Data Mining мы с Вами разобрались. Сегодня мы поговорим о закономерностях, которые лежат в основе алгоритмов Data Mining-а.

Выделяют пять стандартных типов закономерностей, которые позволяют выявлять  методы Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование. Давайте попробуем разобраться как они применимы на практике.

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 70% купивших творог берут также и сметану, а при наличии скидки от одного производителя такую пару продуктов покупают в 80% случаев . Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки квартиры в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил. Например, может определяться надежность клиента банка по ряду критериев.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных. Как правило, на основе кластеризации формируются новые продукты.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается построить шаблоны, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

В настоящее время в России очень мало коммерческих организаций применяют данные принципы на практике. Лишь некоторые крупные организации могут себе это позволить ну и зря. Применяя алгоритмы Data Mining-а можно значительно увеличить объем реализации продукции, практически не затрачивая дополнительных средств на продвижение.

Успехов в применении!


Data Mining и народные приметы

0

Для более глубоко понимания как же применять Data Mining в прогнозировании, давайте проведем простую параллель между народными приметами и методами Data Mining. Удивительно, но народные приметы это такой же способ прогнозирования, но мы об этом не задумываемся.
Народные приметы создавались на основе постоянных наблюдений, но за явлениями природы. И если раньше, события фиксировались лишь в головах, то сейчас мы тоже самое делаем с помощью применения IT технологий.

«Ласточки летают близко к земле, быть дождю». Люди заметили, что после того, как ласточки низко летали над землей, шел дождь. Т.е. одно событие являлось следствием другого события, т.е. любая народная примета это ничто иное как применение методов Data Maning-а на основе корреляционного анализа.

А теперь Вы уважаемые читатели подумайте, как Ваши данные связаны между собой?

Вот Вам для примера несколько взаимосвязанных процессов — сбой поставок и объемы продаж, открытие регионального филиала и объем продаж. Это то, что может лежать на поверхности и если Вы анализируете внутренние факторы, но Вы же можете этим не ограничиться. Вы работаете в ритейле и узнали о том, что в районе Вашего магазина выключена вода, продажи бутилированной воды могут пойти вверх. Не забудьте позаботится о своих складских запасах.

Также и Вы можете анализировать свои данные и находить в них такие же закономерности и использовать при построении прогнозов. Удачи в работе!


Data Mining

0

Давайте разберемся что такое Data Mining и как его можно применять при прогнозировании.
Корпоративная база данных любого современного предприятия обычно содержит набор данных, хранящих записи о тех или иных фактах либо объектах (например, о товарах, их продажах, клиентах, счетах).
Как правило, каждая запись в подобной таблице описывает какой-то конкретный объект или факт. Например, запись в таблице продаж отражает тот факт, что такой-то товар продан такому-то клиенту тогда-то таким-то менеджером, и по большому счету ничего, кроме этих сведений, не содержит. Однако совокупность большого количества таких записей, накопленных за несколько лет, может стать источником дополнительной, гораздо более ценной информации, которую нельзя получить на основе одной конкретной записи, а именно — сведений о закономерностях, тенденциях или взаимозависимостях между какими-либо данными.
Примерами подобной информации являются сведения о том, как зависят продажи определенного товара от дня недели, времени суток или времени года, какие категории покупателей чаще всего приобретают тот или иной товар, какая часть покупателей одного конкретного товара приобретает другой конкретный товар, какая категория клиентов чаще всего вовремя не отдает предоставленный кредит.
Применение методов Data Mining-а очень полезно в прогнозировании. О том, какие это методы и секреты их применения Вы можете узнать на страницах моего блога.
Удачи в работе!


Вверх
Яндекс.Метрика