Big Data

Big Data Landscape 2016

1

Все ключевые инструменты в одной картинке (кликабельно)!

Machine learning сменил Big Data

2

Интересная статейка. Когда это должно было произойти.

Все-таки не зря я говорил, что это маркетинг вендоров. Успешных кейсов по Big Data не так много. На смену теперь пришли алгоритмы machine Learning. А вот визуальная классификация алгоритмов.

 

Удачи Вам!

PSPP – бесплатная замена SPSS Statistics

0

Обнаружил интересный проект, по мнению авторов которого, они считают свое решение полноценной заменой SPSS Statistics, информацию можно найти по адресу https://www.gnu.org/software/pspp/. Там же можно найти и скачать дистрибутив и документацию.

Как пишут авторы есть всего несколько отличий: ваши лицензии никогда не закончатся, нет никаких ограничений по количеству строк и столбцов, система поддерживает больше миллиона значений и переменных, вся функциональность содержится в базовом пакете, не нужно искать никаких расширений, как это сделано в SPSS. Все эти ограничения конечно же положительные.

Небольшое добавление: если у вас windows придется немного повозится чтобы поставить cygwin.

Ну что же, нужно протестировать и составить свое впечатление. Мое убеждение о том, что инструмент сейчас обесценивается, только растет. В тренде именно отраслевые бизнес-решения.

Удачи вам и не спешите платить за инструмент, пусть даже вам его продает команда лучших маркетологов!

Что компаниям нужно от Data Scientist

0

Многие компании на рынке, вероятно после участия их IT в конференциях или начитавшись зарубежной литературы/прессы начали подбирать себе персонал, имеющий соответствующий опыт на позицию Data Scientist (Data – аналитик). Самое смешное, что сейчас многие просто меняют название вакансий аналитиков, добавляют в требования в Python и R, все, получается Data Scientist.

Не знаю, конечно, какую они цель преследуют и какие конкретно задачи решают, но после детального изучения таких вакансий заметил одну интересную особенность.

  • Практически в 95% случаев требуется знание Python и R, иногда требуется знание SQL. Как будто другой инструментарий компании попросту игнорируют или не хотят использовать. Причем иногда это именно обязательные требования. Мне очень странно это видеть, понятно, что это все Open-source инструменты (бесплатные), достаточно скачать интерпретаторы, но ведь очевидно, что поддерживать это хозяйство достаточно затратно с точки зрения персонала, документации кода и т.д.  Ок, я не против, но мне как-то режет это слух. Т.е. если человек использует

Далее >

BDaaS – Big Data as a Service

0

Недавно услышал новый термин и сразу резануло ухо. Опять новомодное слово. Скоро все что сдается в аренду будет иметь приставку aaS – As a Service – как сервис. С одной стороны я согласен, что стоимость владения некой инфраструктурой действительно можно оптимизировать, если взять эту инфраструктуру в аренду. С другой стороны, зачем брать нечто в аренду, что не дает тебе никакого бизнес-value. Ведь не для всякого бизнеса Big Data вообще может дать какой-то результат. То есть этот результат будет, но выигрыш будет ничтожным по сравнению с тем, что может дать и традиционный инструментарий.

Причем что интересно, количество решений, позволяющих решать задачи класса Big Data растет просто ошеломляющими темпами, но при этом громких успешных кейсов не так-то и много и более того часть этих кейсов можно решать традиционным способом. На мой взгляд есть более перспективная ниша, а именно не просто Big Data as a Service а готовый сервис с Далее >

Вверх