BDaaS — Big Data as a Service

0

Недавно услышал новый термин и сразу резануло ухо. Опять новомодное слово. Скоро все что сдается в аренду будет иметь приставку aaS — As a Service — как сервис. С одной стороны я согласен, что стоимость владения некой инфраструктурой действительно можно оптимизировать, если взять эту инфраструктуру в аренду. С другой стороны, зачем брать нечто в аренду, что не дает тебе никакого бизнес-value. Ведь не для всякого бизнеса Big Data вообще может дать какой-то результат. То есть этот результат будет, но выигрыш будет ничтожным по сравнению с тем, что может дать и традиционный инструментарий.

Причем что интересно, количество решений, позволяющих решать задачи класса Big Data растет просто ошеломляющими темпами, но при этом громких успешных кейсов не так-то и много и более того часть этих кейсов можно решать традиционным способом. На мой взгляд есть более перспективная ниша, а именно не просто Big Data as a Service а готовый сервис с преднастроенными моделями данных, позволяющих решать конкретные задачи бизнес-заказчика. Такие модели должны быть не просто построены на статичной архитектуре, а быть адаптивными к набору данных заказчика. И хотя я скептически отношусь к разного рода готовым моделям в BI. Готовое решение, с реальными зашитыми бизнес-кейсами внутри, которое можно потестировать на своих данных, является более многообещающим решением, на мой взгляд, чем использования технологий обработки данных.

Что толку тестировать инструмент без решения конкретной задачи, если можно решать уже конкретную бизнес-задачу на своих данных, оценивать эффективность и практически мгновенно понимать на сколько использование этого инструментария окупается.

На мой взгляд появление такого рода систем позволит сделать качественный скачок в обслуживании клиентов при небольших затратах организации.

Я пока мало слышал о таких готовых решениях, есть наработки по обработке данных соц. сетей при обработке отзывов, надеюсь мы будем слышать о таких решениях все чаще и они действительно рано или поздно вытеснят традиционный инструментарий.

Удачи вам! Стройте умный бизнес!

Удачи Вам!

Data sharing и его преимущества для бизнеса

0

Data sharing еще один тренд — дословно «обмен данными»  — этой такой подход в научном сообществе, который позволяет делиться своими данными с другими исследователями.

А что если бы можно было использовать данные, доступные в одном бизнесе в другом и наоборот. Какой нескончаемый потенциал этих данных, насколько знания о клиентах можно было бы повысить и сделать таргетированные предложения более точечными.

Я считаю, что этот тренд уже реализуется многими успешными корпорациями, например, телекомы идут в банковскую сферу, розница двигается в сторону банковских переводов, почта двигается в сторону e-commerce и логистики. Есть масса других примеров.

На мой взгляд такие знания о клиентах дают большие преимущества, здесь как раз 1+1 = 3 реализуется в полной мере.

Но есть и негативные моменты.

Много говорится о приватности пользователей, хотят ли клиенты, чтобы о них столько знали? К сожалению правда такова, что используя приложения, используя соц. сети и сервисы геолокации мы уже позволяем знать о себе очень много и отказываемся от приватности.

Не всегда эта информация идет нам на пользу. Например, потенциальные работодатели могут отказаться от многообещающего сотрудника по причине его нестандартных политических взглядов. Кроме этого, многие сотрудники потеряли работу только потому что на страницах соц. сетей выразили мнение, которое отражает их индивидуальную точку зрения, которая может противоречить мнению «большинства».

Что дальше?

Сеть Интернет содержит в себе множество информации о клиентах и с развитием инструментов text mining вероятно появятся целые открытые библиотеки, которые будут содержать информацию о пользователях и их предпочтениях. Возможно, такие данные в скором времени можно будет получить бесплатно или за деньги.

А с развитием тренда IoT (Интернета вещей), не удивлюсь, что в скором времени о всех пользователей микроволновок будет известно, что человек ел на обед или ужин, какой запас яиц у него остался в холодильнике, а в супермаркете людям будут напоминать, что у вас заканчивается сливочное масло, не хотите ли купить его по спец. цене.

Ждем с нетерпением появления новых инструментов, которая позволят улучшить нашу жизнь!

Удачи вам!

Интересный парадокс в BI

0

Все чаще я сталкиваюсь с ситуациями, когда о внедрениях бизнес-систем рассказывают не заказчики, а специалисты по технологиям. И получается, что во главу угла спикер ставит технологии, а не решение конкретных прикладных задач. То есть говорится примерно так: «посмотрите какое решение, оно работает быстро и вы получаете быстро доступ к данным, получаете возможность в различных разрезах посмотреть информацию» ну и т.д. Неопытные в вопросе менеджеры клюют на удочку, посмотрев такую презентацию. Бегут в свой IT и говорят «вот хотим также и побольше». И тут начинается самое интересное. IT просит сформулировать, а что вы собственно хотите. Вы как заказчик должны сформулировать ТЗ, требования, описать данные, которые вам нужны, описать методику и т.д. Конечно, заказчик заказчику рознь, но примерно в 95% случаев заказчик начинает недоумевать, я хочу проще, больше и быстрее, а IT меня заставляет делать, как он думает, их работу. Хорошо, если в компании есть деньги и они могут привлечь опытных интеграторов, которые смогут описать все то, что хочет заказчик, положить на бумагу и помочь IT реализовать все хотелки заказчика, подобрать соответствующий спектр продуктов, если IT это самостоятельно сделать не может.
А если компания начинает это делать самостоятельно, то с большой долей вероятности, если заказчик не может сформулировать, что же ему нужно, проект обречен на провал. Даже если он безупречно сделан технически, по сути это будет «чемодан без ручки», вроде он есть, а вот применить его нельзя.
Пока не появится заказчик, который не скажет, что же именно ему нужно, как правильно посчитать показатели, описать бизнес-приложения этих данных, все это будет лежать мертвым грузом в компании, компания будет нести колоссальные издержки.
Я не считаю удачной концепцию, когда технологии ставятся на первом месте. Все это полный бул шит. Технологии помогают более эффективно решать бизнесу задачи. Заказчик должен понимать для чего используется та или иная технология, отдавать себе отчет, что ее применение эффективно и работать в тесной связке с IT.
Когда стоит задача одна, например, переплыть речку, а для ее решения мы строим трансатлантический лайнер, который явно предназначен для другого, то такие внедрения точно до добра не доводят. Ровно как и наоборот, мы хотим дешевле, выбираем Open source, но при этом не хотим и не желаем инвестировать в персонал. Потом начинаем видеть риски в том, что обучаем персонал, а он уйдет, давайте лучше дороже, но промышленное и так по кругу.
Задача на первом месте, технология ее решения на втором, а бантики на последнем. И где-то параллельно на всех этапах квалифицированный персонал.
Удачи вам! Be wise!

Нужно ли компании Data Lake

0

Недавно услышал новый термин, Data Lake (Озеро данных) — речь идет о подходе к хранению больших данных. Не нужно тратить большие деньги на преобразование данных, а нужно хранить их в первоначальном виде. Вероятно, тогда хранить эти данные дешевле. Главное, чтобы к ним был простой доступ и возможность их оперативного использования в случае необходимости.

CTO компании Teradata Стивен Бробст сформулировал  5 заповедей «озера данных» (взял в статье на Cnews).

Он приводит 5 простых советов по развертыванию «озер данных», которые позволят компаниям эффективнее использовать накапливаемые данные.

Не засоряйте «озеро данных». При том, что данные могут храниться в «озере» без структуры, все же имеет смысл сразу организовывать пространство для хранения и размещать данные по категориям. Тогда любой пользователь сможет быстрее найти и применить необходимые ему данные. А «озеро» не превратится в «болото».

Обеспечьте безопасность данных в «озере». Защита персональных данных и конфиденциальной информации сразу должна стать первостепенной задачей. Данные из «озера» не должны «утекать» или создавать проблемы с регуляторами.

Снабдите аналитиков необходимыми инструментами для исследования, профилирования и получения ответов на свои запросы из «озера данных». С данными сразу должны иметь возможность работы не только (и не столько) разработчики, но и бизнес-специалисты, которым эти инструменты будут полезны.

Поддерживайте доверие к данным. Данным из «озера» будут доверять, и для поддержки этого доверия нужно, как минимум, фиксировать их происхождение. Особое внимание следует уделить качеству метаданных.

Свяжите «озеро данных» с аналитической экосистемой предприятия. В «озере» должны накапливаться структурированные, полуструктурированные и неструктурированные данные, а само по себе «озеро» будет представлять симбиоз технологий Hadoop, реляционных баз данных и NoSQL, а также облачных сервисов. При этом «аппаратная» составляющая должна быть выбрана по принципу минимальной стоимости хранения информации. В идеале все данные должны храниться «вечно», но с минимальными издержками.

 

Несмотря на то, что термин новый, не скажу, что это какой-то новый подход. Раньше компании им также пользовались, допустим хранили данные на низкоскоростных жестких дисках, которые дешевле, а все что нужно использовать регулярно имеется в хранилище на быстрых дисках или in-memory. Я конечно во всем вижу маркетинговые ходы, и конечно Teradata не исключение, в том плане что новая философия больше навязывается с целью продать свое оборудование. Я же считаю, что не всем оно нужно, и не обязательно делать это самое озеро. Опять же нужно точно отдавать себе отчет, что данные будут использоваться, а не просто храниться, в надежде на авось пригодится. Более того, я считаю, что глубина хранения данных уже не столь актуальна, потому что мы настолько стремительно все меняемся с появлением новых технологий, что за год происходят значительные изменения в поведении, соответственно детальные сырцы с историей хранения больше года имеют все меньшую прикладную ценность. Поэтому прежде чем использовать новомодную философию, подумайте, действительно оно вам нужно?

Или вами движет намерение пощеголять новомодными словечками на конференции, вот мы сделали Data Lake, вот мы такие крутые.

Если вы технические спецы, спросите бизнес, как они это используют? Конечно, иногда такие вопросы воспринимаются в штыки, типа вам какая разница как используется, нам нужно. Называйте конкретную цену хранения, попросите защитить кейсы. Не всегда оно нужно, поверьте.

И в заключении небольшая классификация ПО. Очень мне понравился график Тома Андерсена. Не могу не поделиться.

Удачи вам! Подходите к хранению данных с умом.

Квадрант Гартнера для систем бизнес аналитики 2015

0

Особенно комментировать нечего, практически ничего не поменялось, единственное Tibco Software чуть опустился, видимо не достаточно «проплатили» общение с аналитиками. В остальном же среди лидеров изменений нет, плюс-минус в пределах погрешности изменения. 

Ну и для сравнения напоминаю квадрант 2014 год

Вверх
Яндекс.Метрика