나는 자바를 학습하고, 학습하는 방법을 계획, 빅 데이터 개발을 시도하고자했다?

나는 자바를 학습하고, 학습하는 방법을 계획, 빅 데이터 개발을 시도하고자했다?


큰 데이터 방향 작품 소개
두. 빅 데이터 엔지니어의 기술 요구 사항
III. 대형 데이터 학습 경로
IV. 권장 학습 자료 (책, 블로그, 웹 사이트)


대규모 작업 데이터의 방향을

: 직장 빅 데이터 방향은 현재 세 개의 주 방향으로 분할된다
01. 빅 데이터 엔지니어
02. 데이터 분석
03. 빅 데이터 과학자
데이터 마이닝 기계 학습의 본질로서 간주 04. 기타 (및 관련 데이터뿐만 아니라, 대용량의 데이터로 이해 될 수있다 한 방향으로, 오른쪽)


II. 빅 데이터 엔지니어의 기술 요구 사항

두 개의 큰 동봉 된 신뢰할 수있는 데이터가 엔지니어 기술 (그림 침공은 삭제)


및 A, LT; IMG 데이터 rawheight = "1058"SRC = "https://pic3.zhimg.com/50/v2-2712bddb7af89f1955333486b828271e_hd.jpg"데이터 rawwidth = "720"클래스 = "zh를 origin_image-즐겨 엄지" 폭 = "720"원본 데이터 = "https://pic3.zhimg.com/v2-2712bddb7af89f1955333486b828271e_r.jpg"/ & A]한다 v2-2712bddb7af89f1955333486b828271e_hd.jpg
및 A, LT; IMG 데이터 rawheight = "1058"SRC = "https://pic2.zhimg.com/50/v2-4ab509dd652081d2963cf9cf2a571665_hd.jpg"데이터 rawwidth = "720"클래스 = "zh를 origin_image-즐겨 엄지" 폭 = "720"원본 데이터 = "https://pic2.zhimg.com/v2-4ab509dd652081d2963cf9cf2a571665_r.jpg"/ & A]가된다; v2-4ab509dd652081d2963cf9cf2a571665_hd.jpg
总结如下:


必须技能10条:
01.Java高级(虚拟机、并发)
02.Linux 基本操作
03.Hadoop(此处为侠义概念单指HDFS+MapReduce+Yarn )
04.HBase(JavaAPI操作+Phoenix )
05.Hive(Hql基本操作和原理理解)
06.Kafka
07.Storm
08.Scala需要
09.Python
10.Spark (Core+sparksql+Spark streaming )
11.一些小工具(Sqoop等)

高阶技能6条:
11.机器学习算法以及mahout库加MLlib
12.R语言
13.Lambda 架构
14.Kappa架构
15.Kylin
16.Aluxio


三.学习路径

由于本人是从Java开发通过大概3个月的自学转到大数据开发的。所以我主要分享一下自己的学习路劲。

第一阶段:
01.Linux学习(跟鸟哥学就ok了)
02.Java 高级学习(《深入理解Java虚拟机》、《Java高并发实战》)


두 번째 단계 :
03.Hadoop (책에 동 서쪽)
04.HBase ( "HBase를 확실한 가이드")
05.Hive ( "하이브 개발 가이드")
( "빠른 학습 스칼라") 06.Scala
07.Spark ( "빠른 점화 빅 데이터 분석 ")
08.Python (확인에 리아 Xuefeng을 배울 수있는 블로그에 따라)


세 번째 단계 :
인터넷에 대응하는 기술 요구 사항 등이 확인에 대한 몇 가지 정보를 수집하기 위해, 나는 (당신에게 무엇을 배울 수) 가장 중요한 것은 넣고,
나머지는 당신이 확인에 해당하는 데이터를 수집하는 법을 배워야한다는 것입니다

당신이 효율성을 읽는 것은 너무 느린 것 같은 느낌 경우에, 당신은 과정 다음에 일부 온라인 코스를 수집 할 수 있으며, 확인도 걸릴. 이것은 완전히 자신의 상황을 기반으로합니다. 독서 효율은 자신의 독서에 반대로 매우 높은 순 클래스는 아닌 경우.


네 개의 학습 리소스 권장 사항 :

01.Apache 공식 웹 사이트
02.Stackoverflow
04.github
03.Cloudra 공식 웹 사이트
04.Databrick 공식 웹 사이트
1 (마이크로 채널 대중 번호) 학습 05. 빅 데이터
06.CSDN, 51CTO
책을 07로를을 Dangdang 검색이 많은, 사실, 내용이 비슷있을 것입니다.

그리고 마지막으로 중요한 점 : 기술 동향, 지속적인 학습에 더 많은 관심을 지불합니다.


추천

출처blog.51cto.com/14342636/2401820