Hajm 397 sahifalar
2012 yil
Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики
Kitob haqida
По убеждению Билла Фрэнкса, ведущего аналитика всемирно известной компании Teradata, уже сейчас наступила эпоха совершенно новых подходов в аналитической сфере и в использовании больших объемов данных. Что такое большие данные, каково их значение, каковы методы, технологии и принципы новейшей аналитики и как это повлияет на последующее развитие бизнеса – в этой книге вы найдете подробную, четко структурированную, изложенную простым языком и наиболее полную информацию об этом явлении.
Книга начинается восторженными заявлениями о перспективах анализа больших данных («Большие данные? Ух, мы вас сейчас проанализируем!»). Эта эмоциональность к концу первой главы начинает надоедать.
Приводится несколько примеров источников больших данных, но когда речь заходит о методах анализа, то повествование не распространяется дальше общих фраз. Если считать это обзором, то упоминается слишком мало инструментов и технологий.
На мой взгляд, лучше всего проработана глава 3, в которой описываются требования к бизнес-аналитикам и их месте в структуре организации. Эта часть может быть интересна для HR-специалистов и руководителей. Но о больших данных в этой главе – ни слова.
Общий вывод: книга носит обзорный характер и подойдёт для первого знакомства с возможностями, которые открывает аналитическое подразделение для бизнеса. Я бы назвал её «Бизнес-аналитик: введение в специальность».
Книга интересна хотя бы тем, что она является первой (одной из первых?) по теме больших данных. То есть «модному термину» дается более-менее достаточное объяснение. С этой точки зрения, книга вроде бы для бизнеса. Но в ней есть и технические детали, в которые бизнес вникать не будет (если не имеет в бэкграунде) технического образования.
И в то же время эти технические детали явно недостаточны для того, чтобы начать что-то делать своими руками.
Большинство примеров использования big data – из веб-коммерции и розницы (RFID). Примеров из других областей (телеметрия, медицина) намного меньше и они менее конкретные.
Резюме: книга хороша как первая книга по теме для топ и миддл-менеджеров и бизнес-аналитиков, которые занимаются чем-то другим. Менеджмент поймет, какие задачи может ставить. Бизнес-аналитики будут «в курсе происходящего».
Для технических специалистов, архитекторов, системных аналитиков, аналитиков данных – необходимо что-то более глубокое и системное.
Ещё одна книга, которую я рекомендую к прочтению всем, кто хочет понять насколько глубока кроличья нора.
Этот потрясающий труд разительно отличается от книги «Большие данные», Виктора Майер-Шенбергера и Кеннета Кукьера. Её написал Билл Фрэнкс – директор по бизнес-аналитике компании Teradata, и это о многом говорит. Автор знает о больших данных столько, что позволил себе предложить подход к работе с огромными объёмами данных. Книга настолько хорошо структурирована, что читать её – одно удовольствие.
Значимость большим данным придает вовсе не то, что они большие, и даже не то, что они представляют собой данные. Важно то, как вы анализируете и применяете эти данные для развития своего бизнеса.
И не важно сколько у вас данных – 10 мегабайт или 10 петабайт. Если вы сейчас не в силах их проанализировать и использовать, то это и есть большие данные, которые могуть стать вашей большой проблемой.
Также мне понравилась очень точная мысль про инновации, которые в нашей стране и сопредельных очень часто, хотя нет, почти всегда, путают с чем-то другим.
Автор рассказывает и об основных технологиях для проведения анализа и обработки данных – о модели MapReduce, Hadoop и об R. Да, он рассказывает о них совсем чуть-чуть, но и этого достаточно, чтобы понять спектр решаемых проблем и области применения.
Предложенный подход по работе с данными очень похож на то, что я изобразил в магистерской диссертации и это заставило меня улыбаться. Методы и процессы, которые предлагает автор, при должном подходе, позволят организации получить максимальную выгоду от имеющихся данных.
Чтение оставило массу положительных впечатлений и всего лишь одно отрицательное – книга очень быстро закончилась. Читается на одном дыхании, рекомендую всем – от младшего инженера до главного руководителя.
Рекомендую тем, кто решил начать анализировать данные на более профессиональном уровне
Izohlar, 4 izohlar4