Big Data вводный учебник нуля обучения Hadoop

1, Hadoop экологический профиль

Hadoop является Фонд Apache, разработанный распределенной системой интеграции архитектуры, пользователь может не знать, в основных деталях распределенного случае, разработка распределенных программ, в полной мере использовать мощность кластера для высокоскоростных вычислений и хранения, надежных, эффективных, Телескопическая функции

Ядро Hadoop является ПРЯЖИ, HDFS, MapReduce, общая модульная архитектура следует

2, HDFS

ГФС документы из Google, и опубликовано в октябре 2013 года, HDFS версия клона GFS, HDFS является основой для системы управления хранением данных Hadoop, который является в высшей степени отказоустойчивой системы, которая может обнаруживать и реагировать на аппаратные сбоев

Консистенция файла HDFS упрощает модель, с помощью потокового доступа к данным, обеспечивает данные приложений доступа с высокой пропускной способностью для приложений с большими наборами данных, который обеспечивает механизм для однократной записи чтения много раз, блок данных образуют, в то время как в другом физическом кластере машины

3, MapReduce

Полученный из бумаги MapReduce Google, рассчитывается для большого количества данных, который экранирует распределенные вычислительные инфраструктуры детали, расчет карты и снизить отведенной на две части

4, HBase (колонка памяти распределенной базы данных)

Bigtable бумага от Google, встроенный в верхней части HDFS, колонки-ориентированных данных для структурированных масштабируемой, высоконадежные, высокопроизводительные колонки-ориентированной распределенной и динамический режим базы данных

5, зоопарк

Решение проблем управления данными в распределенной среде, единого имени, синхронизации состояний, управление кластером, синхронизации конфигурации

6, HIVE

Доход от Facebook, определяет подобный язык запросов SQL, SQL будет преобразован в задачи MapReduce, выполняемых в Hadoop выше

7, желоб

инструмент сбора Вход

8, пряжа распределены менеджеры ресурсов

Это следующий MapReduce поколения, в основном решить исходную плохую масштабируемость Hadoop, разнообразие вычислительной структуры не поддерживает предлагаемую архитектура следует
Big Data вводный учебник нуля обучения Hadoop

Концепция больших объемов данных и искусственного интеллекта являются неточными, в соответствии с тем, что линия, чтобы узнать, где завершение разработки, хотят учиться, хотят учиться студенты приветствуют присоединиться к Big Data обучения юбки: 606 859 705, есть много сухих грузов (ноль базовый и продвинутый боевой классический) доля для всех, так что мы знаем, наиболее полный большой внутренний высокого класса реальной практической системы процесса обучения данных. Начиная с Java и Linux, а затем постепенно глубоко в Hadoop-улей-oozie-веб-лотковый-питон-HBase-Кафка-СПАРК-Скала одиннадцать других связанных с ними знаний, чтобы поделиться!

9, искра

искра обеспечивает более быструю и универсальную платформу обработки данных, и сравнение Hadoop, искра может сделать вашу программу работы в памяти

10, Кафка

Распределенные очереди сообщений, в основном для потоковой обработки данных Активной

11, Hadoop псевдо-распределенного развертывания

На данный момент нет версии заряд Hadoop Там не три, все иностранные производители, а именно

1, Apache оригинальная версия

2, версия CDH, для домашних пользователей, подавляющее большинство выбранной версии

3, HDP версия

Здесь мы выбираем CDH версия Hadoop-2.6.0-cdh5.8.2.tar.gz, среда CentOS7.1, JDK 1.7.0_55 необходимость более

[Корень @ hadoop1 ~] # useradd Hadoop

Моя система поставляется с Java по умолчанию среды является

Big Data вводный учебник нуля обучения Hadoop

Добавьте следующие переменные окружения

Big Data вводный учебник нуля обучения Hadoop

Выполните следующие действия разрешения

Big Data вводный учебник нуля обучения Hadoop

Здесь пользователи Hadoop для управления различных услуг и запуском Hadoop

Big Data вводный учебник нуля обучения Hadoop

Посмотреть сервис начинает обстоятельства

Big Data вводный учебник нуля обучения Hadoop

Big Data вводный учебник нуля обучения Hadoop

рекомендация