Неплохая книга, чтобы начать знакомство со Spark. Книжка полезна всем: разработчикам, дата-инженерам и одна (последняя) глава для дата-сайнтистов. Недостаток книги – она устаревшая, т.к. в ней рассматриваются только RDD. Но для «прыжка» книжка весьма неплоха
Hajm 306 sahifalar
2015 yil
Изучаем Spark. Молниеносный анализ данных
Kitob haqida
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Достоинства:
Практически все темы раскрыты
Недостатки:
Рассматриваемая версия Spark старовата
Подходит для понимания основ Spark. Действительно уже устарела, так как на носу версия Spark 3.0.0. В целом читается очень хорошо, материал изложено доступно
Izoh qoldiring
Izohlar
3