스톰 빅 데이터 배포 및 설치 개요 (33)을 계산하는 실시간 학습

A : 폭풍의 개요

 

URL : http://storm.apache.org/

 

ApacheStorm는 무료 오픈 소스 분산 실시간 컴퓨팅 시스템이다. 스톰 쉽고 안정적으로 만들어 하둡 배치에 대한 실시간 처리를위한 무제한 데이터 스트림을 처리 할 수 ​​있습니다. 스톰은 매우 간단하고 어떤 프로그래밍 언어를 사용할 수 있으며, 사용하는 재미!

 

그래서 실시간 분석, 온라인 기계 학습, 연속 컴퓨팅, 분산 된 RPC, ETL과 : 많은 사용 사례 스톰이 있습니다. 스톰은 곧 : 벤치 마크는 각 노드가 세트당 만 개 이상의 위안 처리하는 것을 의미한다. 그것은 확장 성, 내결함성, 설정 및 작동이 데이터 처리를 얻을 수 있는지 확인하고, 쉽게.

 

이미 사용 스톰 통합 대기 및 데이터베이스 기술. 폭풍 토폴로지 소비 데이터 스트림이 스트림의 임의의 복잡하게하고이어서 각 상 유동의 계산 사이의 재분할. 더 자습서를 읽어보십시오.

 

무엇 오프라인 컴퓨팅은 무엇입니까?

 

벌크 데이터, 대량의 데이터 전송, 데이터 저장 용량, 데이터주기 계산, 데이터 시각화를 가져옵니다

수로는, 대량의 데이터를 얻을 벌크 전송 HDFS / 하이브 / HBase를 벌크 저장 씨 / 하이브 계산 데이터, BI를 Sqoop을

 

 

무엇 실시간 컴퓨팅은 무엇입니까?

 

생성 실시간 데이터, 실시간 데이터 전송, 데이터의 계산, 실시간 디스플레이

수조 실시간 데이터 수집 카프카 실시간 데이터 저장 스톰 / JStorm 실시간 시스템, 실시간 디스플레이 (dataV / quickBI)

 

2 : 스톰과 하둡

  

 

하둡

폭풍

 

역할

JobTracker에

후광

TaskTracker

감독자

어린이

노동자

응용 프로그램 이름

토폴로지

프로그래밍 인터페이스

매퍼 / 감속기

르네 / 볼트

 

세 : 스톰 프로그래밍 모델

tuple : 원조

메시지 전송은 기본 단위.

 

주둥이 : 수도꼭지를

폭풍의 핵심 추상화입니다. 소스 토폴로지 스트림입니다. 외부 데이터 소스에서 데이터를 읽을 일반적으로 주둥이. 내부 데이터 소스로 변환된다.

 

主要方法:nextTuple() -》 发出一个新的元祖到拓扑。

      ack()

      fail()

 

Bolt:转接头

Bolt是对流的处理节点。Bolt作用:过滤、业务、连接运算。

 

Topology:拓扑

是一个实时的应用程序。

永远运行除非被杀死。

Spout到Bolt是一个连接流...

 

storm流式计算

hadoop与storm兼容性

 

闲聊:。。。。

spark-core

spark-sql离线计算

spark-streaming流式计算

一个团队开发 没有兼容性问题

spark团队:我要做一栈式开发平台!

但凡涉及到大数据计算 我都能搞定!

spark替代了mapreduce

spark没有底层存储

依赖hdfs

hdfs/mr............

完善整个生态圈系统!

mapreduce思想、编程 、sqoop->mr hive->mr hbasemr

dfs/mapreduce/bigtable

java/scala...

 

四:Storm集群安装部署

1)准备工作

zk01 zk02 zk03

storm01 storm02 storm03

 

2)下载安装包

http://storm.apache.org/downloads.html

3)上传

4)解压

5)修改配置文件

设置环境变量~/.bash_profile

$ vi storm.yaml

# 设置Zookeeper的主机名称

storm.zookeeper.servers:

- "bigdata11"

- "bigdata12"

- "bigdata13"

 

# 设置主节点的主机名称

nimbus.seeds: ["bigdata11"]

 

# 设置Storm的数据存储路径(需要自己提前创建)

storm.local.dir: "/root/training/storm/data"

 

# 设置Worker的端口号

supervisor.slots.ports:

- 6700

- 6701

- 6702

- 6703

分发到bigdata12 bigdata13,还有~/.bash_profile也要分发

 

6)启动nimbus

$ storm nimbus &

 

7) 启动supervisor

$ storm supervisor &

 

8)启动ui界面 端口8080

$ storm ui 

 

Storm命令行操作

1)查看命令帮助

storm help

 

2)查看版本

storm version

 

3)运行storm程序

storm jar [/路径/.jar][全类名][拓扑名称]

 

4)查看当前正在运行拓扑及其状态

storm list

 

5)终止拓扑程序

storm kill [拓扑名称]

 

6)激活拓扑程序

storm activate [拓扑名称]

 

7)禁止拓扑程序

storm deactivate [拓扑名称]

추천

출처www.cnblogs.com/hidamowang/p/10981271.html