Big Data

Экономим на моделировании с KNIME

0

Сегодня хотел бы познакомить читателей с одним из инструментов для Data mining.

Все уже наверное, кто так или иначе знаком с Data mining слышали про R, возможно, что многие уже успели даже поработать. Несмотря на богатое многообразие поддерживаемых методов, все-таки среда разработки достаточно специфическая, особенно для людей, далеких от программирования.

Речь пойдет про KNIME (http://www.knime.com) – это open sourse платформа для data driven инноваций (в том числе и методами data mining), которая в отличие от R, обладая достаточно богатым функционалом, имеет еще графический интерфейс.

Я бы сказал, что интерфейс этот ничем не уступает тому же SPSS.

И самое главное преимущество, это все полностью бесплатно. Конечно, если вы хотите поддержку, серверное решение, то придется немного заплатить, но все равно это деньги не соизмеримо меньшие, чем аналогичное решение у других вендоров.

Дистрибутив можно скачать с официального сайта. Там же есть раздел с демо-примерами, видеолекциями. Достаточно просто устанавливается. Честно скажу, глубоко не Далее >

Почему BigData стала трендом

0

25 фактов о BigData, что делает ее трендом.

  1. Каждые 2 дня мы создаем столько информации, сколько создали за все время до 2003 года [Source]
  2. Более 90% всех данных было создано за последние 2 года [Source]
  3. Ожидается, что к 2020 объем цифровой информации вырастетс 3.2 зетабайт до 40 зетабайт. [Source]
  4. Объем накапливаемой информации удваивается за 1.2 года [Source]
  5. Каждую минуту мы отправляем 204 миллиона электронных писемs, ставим 1,8 миллионов лайков в Facebook-е, отправляем 278 тысяч твитов, и закачиваем на Facebook 200 фотографий [Source]
  6. Только поисковик Google обрабатывает 40 тысяч поисковых запросов в секунду или 3.5 млрд. в день [Source]
  7. Каждую минуту на YouTube закачивается 100 часов видео, а для того, чтобы посмотреть одному пользователю видео, закаченное за день требуется 15 лет [Source]
  8. Пользователи Facebook 30 млрд раз расшаривают какую-либо информацию каждый день [Source]
  9. Если закачать все данные мира на DVD и поставить их один на другой, то можно дважды

Далее >

Мифы BigData (english)

0

Натолкнулся на интересные слайды «12 мифов о Big Data».

Миф 1. Никаких больших данных нет Миф 2. Big Data означает просто больше данных Миф 3. Big Data это стратегия Миф 4. Чем больше данных тем лучше вы понимаете объект изучения Миф 5. Big Data это дорого Миф 6. Big Data дешево Миф 7. Big Data это технологии Миф 8. Big Data только для крупных компаний Миф 9. Для Big Data нужен специалист по данным (Data Scientist) Миф 10. Big Data дает конкурентное преимущество. Миф 11. Big Data понятен всем и каждому Миф 12. Big Data это что-то чем следует заниматься

Более подробно смотрите на слайдах

Big Data Marketing Automation

0

Интересная книга о Data Driven Marketing-е, с моей редактурой. Алексей проделал хорошую работу, а после моей критики, еще и улучшил. И книга получилась вполне достойной, правда, конечно, некоторым компаниям до этого еще как до луны пешком.

Не поленитесь купить, оно того стоит. По крайней мере заставляет задуматься, что есть еще куда улучшаться.

http://www.amazon.com/Data-Driven-Marketing-automation-Automation-ebook/dp/B00IQ2E9SS/ref=sr_1_2?s=digital-text&ie=UTF8&qid=1404134805&sr=1-2&keywords=Data+Driven+Marketing

День сурка, Big Data и тренды (Data Driven Services)

0

Прочитал итоги прошедшей 4 июня 2014 г. конференции   «Big Data – технология будущего»

Подробнее вы можете ознакомиться по ссылке:http://bigdata.cnews.ru/reviews/index.shtml?2014/06/11/575622

 

 

Выводы печальные и неутешительные. Прошло 2 года с момента когда я участвовал в круглом столе совместно с коллегами из других телекомов и компанией IBM. Так вот, с того момента, я вам хочу сказать, мало что поменялось. Пожалуй выделился определенный тренд использования дешевых opensource решений для тестирования высоконагруженных задач без какого-либо эффекта.  И все! Прошло 2 года и кейсов особых не добавилось, да, все говорят о том, что можно делать и без технологий Big Data. Вымпелком все ищет птицу счастья, однако не хочу ничего говорить, но их задачи можно решать и без этой технологии. Объемы данных не позволяют тестировать быстро, но все же можно. Пусть так.

Но неужели BigData только для крупных компаний?

На мой взгляд еще далеко не все карты брошены на Далее >

Вверх