Hajm 306 sahifalar
2015 yil
Изучаем Spark. Молниеносный анализ данных
Kitob haqida
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Неплохая книга, чтобы начать знакомство со Spark. Книжка полезна всем: разработчикам, дата-инженерам и одна (последняя) глава для дата-сайнтистов. Недостаток книги – она устаревшая, т.к. в ней рассматриваются только RDD. Но для «прыжка» книжка весьма неплоха
Достоинства:
Практически все темы раскрыты
Недостатки:
Рассматриваемая версия Spark старовата
Подходит для понимания основ Spark. Действительно уже устарела, так как на носу версия Spark 3.0.0. В целом читается очень хорошо, материал изложено доступно
Izohlar, 3 izohlar3