Чтобы узнать, большие данные, вы должны по крайней мере знать, что большие данные, большие данные будут использоваться в каких областях. По общему пониманию больших данных, вы можете узнать, если вы заинтересованы в больших данных.
01
Ноль на основе изучения больших данные имеют следующие шаги:
1, понять теорию больших данных
2, обучающийся язык программирования
3, основные данные, связанные курсы
4, фактический проект
02
Исследование Стадия Рекомендуемые книги:
Фаза 0 Изучение базовой основой: язык Java, Linux
Java можно сказать, что наиболее большой язык базы данных программирования, разработана большой часть больших данных я связался было из Jave разработки веба-перехода на другую работу в течение.
Рекомендуемые книги:
«Effective Java китайская версия»
Если вы хотите узнать самые большие данные добавлены в хорошую среду обучения, это может быть группа Q 251956502, так что все было бы относительно легко учиться, но и общаться и обмениваться информацией об общих
Фаза II, система Big Data Hadoop
Hadoop является открытым исходным кодом распределенных вычислений с использованием платформы разработки языка Java, подходящую для большого хранения данных и распределенных вычислительных платформ. Платформа Hadoop Big Data широко используется, результаты самой работы является большой платформой данных R & D персонала, Hadoop является более общей платформой для поддержки больших объемов данных.
Рекомендуемые книги:
1, "Big Data"
2, "Hadoop The Definitive Guide"
3, «Улей Руководство по программированию»
Фаза III, Scala язык и золото Спарк
Scala и очень похожи на языке Java JVM, выполняющихся в процессе развития бесшовной звонить друг другу. Свеча предназначена для крупномасштабной обработки данных, предназначенной для быстрого вычисления общего назначения двигателя. Свеча является альтернативой MapReduce, и совместим с HDFS, Hive, Hadoop может быть интегрирован в экосистему, чтобы компенсировать отсутствие MapReduce.
Рекомендуемые книги:
1, "Обучение Спарк"
2, «Искра машинного обучения: основные технологии и практика»
Этап IV, большой боевой проект данных (первый уровень реальной проектная компания)
Сбор данных, обработка данных, анализ данных, представление данных, данные приложения