пятница, 17 мая 2013 г.

Справочник по Hadoop для начинающих


"Справочник по Hadoop для начинающих" - это новая вступительная книга к экосистеме Hadoop. Она рассказывает, как наловчиться работать с ключевыми компонентами Hadoop (MapReduce и HDFS), высокоуровневыми инструментами вроде Hive, инструментами интеграции - Sqoop и Flume - и предоставляет начальную информацию о функционировании Hadoop. 

Это не столь исчерпывающее руководство, как Hadoop: The Definitive Guide, но, наверняка, идеально подойдет для начинающих.

Большинство тем глубоко раскрыты. После краткого вступления к теме автор подает список команд или блок кода и предлагает их выполнить. Далее идет часть "Что только что произошло?", в которой объясняются детали операции или кода. Однако, иногда объяснение отделено от самого кода десятками страниц, что особенно неудобно, если читать книгу в формате PDF. Но, возможно, это лишь мое мнение.


Как я уже сказал, книга включает несколько глав об операциях, что мне показалось полезным дополнением к книге для начинающих. Некоторые моменты объясняются с помощью практических экспериментов вроде завершения работы процессов или узлов. Операционные сценарии не являются исчерпывающими, но они предоставляют читателю некий "реальный" опыт, полученный в безопасной среде.

Кроме того, они представляют действенный метод изучения операционных деталей: провести эксперимент и посмотреть, что произойдет. Самое ценное, что может дать вам любая книга, урок или семинар - это научить вас учиться.

Еще одна позитивная и уникальная черта книги - примеры с использованием Amazon EC2 и Elastic Map Reduce (EMR). В нее входят примеры как MapReduce-, так и Hive-задач на EMR.

И все-таки, у меня есть претензии к книге, но большинство из них пустячны или являются делом вкуса. Во-первых, книге пошло бы на пользу "техническое редактирование". Я имею ввиду, что есть некоторые расхождения в деталях.

В заключение хочу отметить, что Справочник по Hadoop для начинающих - отличное введение в экосистему Hadoop. Рекомендую его всем, кто делает лишь первые шаги в работе с Hadoop. 

Комментариев нет:

Отправить комментарий