프로그래머는 10 개 개의 기술을 마스터해야합니다, 빅 데이터에 참여하고 싶다!

전 세계에서 매일 새로운 프로젝트를 설명하는 데에 생겨나 고, 빅 데이터에 관한 특히, 아무리 강조해도 지나치지 않다. 지원으로 더 이상 기술 한 움직임은, 프로그래머는 조심 오의 속도를 따라 가지 수 없습니다. 여기에 인물을 구성, 10 선사 시대의 오픈 소스 빅 데이터 기술을 계산이다!

1.Apache 빔

ApacheBeam은 Java로 개발 된 통합 데이터 파이프 라인 프로세스를 제공하고, 스파크 및 FLINK을 지원할 수 있습니다. 또한, 프레임 워크를 학습 시간과 에너지를 많은 개발자를 저장, 온라인 프레임 워크를 많이 제공합니다.



인터넷 기술 개발 호황을 누리고, 인공 지능의 시대, 다음 출구를 잡았다. 배우고 싶은 인터넷의 방향을 전환 할, 그러나 때문에 시간의 부족, 자원의 부족의 사람들을 도와 포기합니다. 나는 그룹을 배우고 새로운 빅 데이터 및 고급 데이터 고급 개발 가이드, 빅 데이터를 마무리하고 있습니다 : 플러스 199 플러스 210 [427] 마지막으로, 조직 학습이 고급 환영에서 찾을 수 있습니다 및 빅 데이터의 작은 탐구 할 파트너 가입.

640? wx_fmt = 기타 및 TP = WebP 형식 및 wxfrom = 5 wx_lazy = 1 = 1 wx_co

2.Apache Hive2.1

하이브는 하둡 데이터웨어 하우스 인프라를 기반으로합니다. 릴리스의 최신 버전으로, ApacheHive의 성능과 기능은 빅 데이터에 대한 SQL을위한 최고의 솔루션이되었다, 향상되었습니다. 이것은 데이터 추출 변환로드 (ETL)을 위해 사용될 수있는 다양한 도구를 제공한다 -이 저장, 질의하고 하둡에 저장된 대량의 데이터를 분석기구.

3.Hadoop

필요한 YARN을 제공 할 수 효율, 신뢰성, 확장 성 Hadoop--, HDFS와 데이터 저장을위한 인프라 프로젝트, 대형 기본 데이터 서비스 및 응용 프로그램을 실행할 수 있습니다.

640? wx_fmt = 기타 및 TP = WebP 형식 및 wxfrom = 5 wx_lazy = 1 = 1 wx_co

4.Kafka

카프카는 모든 액션 스트리밍 데이터 소비자 규모의 웹 사이트를 처리 할 수있는 분산 발행 - 구독 메시징 시스템의 높은 처리량이다. 자바 스칼라에, 카프카 강한 접착력을 제공하는 타사 플러그인 도구에 다음 NiFi에 불꽃과에서, 대형 데이터 시스템을위한 최선의 선택이되었다 및 비동기 메시지 사이에 분산.

5.NiFi

堪称大数据工具箱里的瑞士×××的ApacheNiFi,是由美国国家安全局(NSA)贡献给Apache基金会的开源项目,其设计目标是自动化系统间的数据流。其中,它的两个最重要的特性是强大的用户界面,以及良好的数据回溯工具。基于其工作流式的编程理念,NiFi非常易于使用,而且强大、可靠、高可配置。

6.Phoenix

作为HBase的SQL驱动,Phoenix目前被大量的公司采用,它正在逐渐扩大规模。HDFS支持的NoSQL能够很好地集成所有工具,Phoenix查询引擎会将SQL查询转换为一个或多个HBasescan,并编排执行以生成标准的JDBC结果集。

640? wx_fmt = 기타 및 TP = WebP 형식 및 wxfrom = 5 wx_lazy = 1 = 1 wx_co

7.Spark

Spark使用简单,而且可以支持所有重要的大数据语言,如Scala、Python、Java、R等。同时,它还拥有强大的生态系统,且成长迅速,对microbatching/batching/SQL的支持也很简单。最重要的是,Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

8.Sparkling Water

H2O填补了Spark’sMachineLearning的缺口,SparklingWater可以满足你所有的机器学习。

9.Stanford Core NLP

自然语言处理拥有巨大的增长空间,斯坦福正在努力增进他们的框架,StanfordCoreNLP横空出世。

10.Zeppelin

Zeppelin是一个提供交互数据分析且基于Web的笔记本,方便用户做出可数据驱动的、可交互且可协作的精美文档。同时,它还支持多种语言,包括Scala(使用ApacheSpark)、Python(ApacheSpark)、SparkSQL、Hive、Markdown、Shell,等等。

在科技圈都知道,作为当今最热门的技术之一的大数据,正呈爆炸式增长。幸运的是,开源让越来越多的项目可以直接采用大数据技术,这也为程序员提供了多一条出路。


빅 데이터의 미래 전망을 기대할 수, 사람들의 라인을 아주 많이, 그리고 얼마나 빨리 전환을 완료하는 신속 빅 데이터의 필드를 입력하는 방법, 우리는 깊은 생각에 흰색 누군지 전환 할 필요가있다.



거기 학습을위한 화이트 포인트는 빅 데이터 산업을 입력하도록 선택한 이후 빅 데이터의 많은,하지만 어떤 경우에, 그것은 단지 투쟁과 고난 것이라는 점을 주목해야한다. 소위 초보자의 마음을 잊지 아니, 항상 광장, 빅 데이터 또는 당신이 가장 필요로 영구적 인 마음을 학습했다.


추천

출처blog.51cto.com/13854477/2406329