admin

admin

Записей (222), комментариев (66)

Нет информации об авторе

Записи автора admin

Что компаниям нужно от Data Scientist

0

Многие компании на рынке, вероятно после участия их IT в конференциях или начитавшись зарубежной литературы/прессы начали подбирать себе персонал, имеющий соответствующий опыт на позицию Data Scientist (Data – аналитик). Самое смешное, что сейчас многие просто меняют название вакансий аналитиков, добавляют в требования в Python и R, все, получается Data Scientist.

Не знаю, конечно, какую они цель преследуют и какие конкретно задачи решают, но после детального изучения таких вакансий заметил одну интересную особенность.

  • Практически в 95% случаев требуется знание Python и R, иногда требуется знание SQL. Как будто другой инструментарий компании попросту игнорируют или не хотят использовать. Причем иногда это именно обязательные требования. Мне очень странно это видеть, понятно, что это все Open-source инструменты (бесплатные), достаточно скачать интерпретаторы, но ведь очевидно, что поддерживать это хозяйство достаточно затратно с точки зрения персонала, документации кода и т.д.  Ок, я не против, но мне как-то режет это слух. Т.е. если человек использует

Далее >

BDaaS – Big Data as a Service

0

Недавно услышал новый термин и сразу резануло ухо. Опять новомодное слово. Скоро все что сдается в аренду будет иметь приставку aaS – As a Service – как сервис. С одной стороны я согласен, что стоимость владения некой инфраструктурой действительно можно оптимизировать, если взять эту инфраструктуру в аренду. С другой стороны, зачем брать нечто в аренду, что не дает тебе никакого бизнес-value. Ведь не для всякого бизнеса Big Data вообще может дать какой-то результат. То есть этот результат будет, но выигрыш будет ничтожным по сравнению с тем, что может дать и традиционный инструментарий.

Причем что интересно, количество решений, позволяющих решать задачи класса Big Data растет просто ошеломляющими темпами, но при этом громких успешных кейсов не так-то и много и более того часть этих кейсов можно решать традиционным способом. На мой взгляд есть более перспективная ниша, а именно не просто Big Data as a Service а готовый сервис с Далее >

Data sharing и его преимущества для бизнеса

0

Data sharing еще один тренд – дословно «обмен данными»  - этой такой подход в научном сообществе, который позволяет делиться своими данными с другими исследователями.

А что если бы можно было использовать данные, доступные в одном бизнесе в другом и наоборот. Какой нескончаемый потенциал этих данных, насколько знания о клиентах можно было бы повысить и сделать таргетированные предложения более точечными.

Я считаю, что этот тренд уже реализуется многими успешными корпорациями, например, телекомы идут в банковскую сферу, розница двигается в сторону банковских переводов, почта двигается в сторону e-commerce и логистики. Есть масса других примеров.

На мой взгляд такие знания о клиентах дают большие преимущества, здесь как раз 1+1 = 3 реализуется в полной мере.

Но есть и негативные моменты.

Много говорится о приватности пользователей, хотят ли клиенты, чтобы о них столько знали? К сожалению правда такова, что используя приложения, используя соц. сети и сервисы геолокации мы уже позволяем знать о себе Далее >

Интересный парадокс в BI

0

Все чаще я сталкиваюсь с ситуациями, когда о внедрениях бизнес-систем рассказывают не заказчики, а специалисты по технологиям. И получается, что во главу угла спикер ставит технологии, а не решение конкретных прикладных задач. То есть говорится примерно так: «посмотрите какое решение, оно работает быстро и вы получаете быстро доступ к данным, получаете возможность в различных разрезах посмотреть информацию» ну и т.д. Неопытные в вопросе менеджеры клюют на удочку, посмотрев такую презентацию. Бегут в свой IT и говорят «вот хотим также и побольше». И тут начинается самое интересное. IT просит сформулировать, а что вы собственно хотите. Вы как заказчик должны сформулировать ТЗ, требования, описать данные, которые вам нужны, описать методику и т.д. Конечно, заказчик заказчику рознь, но примерно в 95% случаев заказчик начинает недоумевать, я хочу проще, больше и быстрее, а IT меня заставляет делать, как он думает, их работу. Хорошо, если в компании есть деньги и они могут привлечь опытных Далее >

Нужно ли компании Data Lake

0

Недавно услышал новый термин, Data Lake (Озеро данных) – речь идет о подходе к хранению больших данных. Не нужно тратить большие деньги на преобразование данных, а нужно хранить их в первоначальном виде. Вероятно, тогда хранить эти данные дешевле. Главное, чтобы к ним был простой доступ и возможность их оперативного использования в случае необходимости.

CTO компании Teradata Стивен Бробст сформулировал  5 заповедей «озера данных» (взял в статье на Cnews).

Он приводит 5 простых советов по развертыванию «озер данных», которые позволят компаниям эффективнее использовать накапливаемые данные.

Не засоряйте «озеро данных». При том, что данные могут храниться в «озере» без структуры, все же имеет смысл сразу организовывать пространство для хранения и размещать данные по категориям. Тогда любой пользователь сможет быстрее найти и применить необходимые ему данные. А «озеро» не превратится в «болото».

Обеспечьте безопасность данных в «озере». Защита персональных данных и конфиденциальной информации сразу должна стать первостепенной задачей. Данные из «озера» не должны Далее >

admin's RSS Feed
Вверх