hadoop大数据平台手动搭建-spark - 代码天地

hadoop大数据平台手动搭建-spark

企业开发 2018-05-09 18:13:31 阅读次数: 1

Spark 是专为大规模数据处理而设计的快速通用的计算引擎。拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。由于spark使用依赖scala.所以一起安装。

1.解压文件

tar -zxvf /opt/spark-1.6.0-cdh5.8.0.tar.gz

tar -zxvf /opt/scala-2.10.4.tgz

2.配置环境变量

# vim /etc/profile

在文件最后添加：

export SPARK_HOME=/opt/spark-1.6.0-cdh5.8.0

export SCALA_HOME=/opt/scala-2.10.4

export PATH=.:$JAVA_HOME/bin:$SACLA_HOME/bin:$PATH //将scala路径添加进环境变量

3. 配置spark-env.sh

Spark-env.sh文件中配置了spark运行时的一些环境、依赖项以及master和slaver的资源配置。

cp conf/spark-env.sh.template conf/spark-env.sh //将spark-env.sh.template复制一份为spark-env.sh

配置如下：

HADOOP_CONF_DIR=/opt/hadoop-2.6.0-cdh5.8.0/etc/hadoop

SPARK_LOCAL_IP=slave1 //这是指spark当前运行机器

SPARK_MASTER_IP=master //主节点ip

SPARK_CLASSPATH=$CLASSPATH:`find /opt/hadoop-2.6.0-cdh5.8.0 -name *.jar|tr '\n' ':'`

SPARK_LOCAL_DIRS=/opt/spark/

HADOOP_HOME=/opt/hadoop-2.6.0-cdh5

4.配置/opt/spark-1.6.0-cdh5.8.0/conf/slaves

master

slave1

slave2

5.拷贝整个目录到slave1,slave2

scp -r /opt/spark-1.6.0-cdh5.8.0 hadoop@slave1:/opt/

scp -r /opt/spark-1.6.0-cdh5.8.0 hadoop@slave2:/opt/

在slave1,slave2上修改spark-env.sh中的

SPARK_LOCAL_IP为当前机器名

5.验证

猜你喜欢

转载自feilong2483.iteye.com/blog/2365051

hadoop大数据平台手动搭建-spark

hadoop大数据平台手动搭建(六)-spark

hadoop大数据平台手动搭建-hadoop

hadoop大数据平台手动搭建(二)-hadoop

hadoop大数据平台手动搭建-hive

hadoop大数据平台手动搭建-sqoop

hadoop大数据平台手动搭建-hbase

hadoop大数据平台手动搭建-hue

hadoop大数据平台手动搭建-ssh,ntp

hadoop大数据平台手动搭建(七)-hue

hadoop大数据平台手动搭建(五)-sqoop

hadoop大数据平台手动搭建(四)-hbase

hadoop大数据平台手动搭建(三)-hive

hadoop大数据平台手动搭建(八)HDFS High Availability Using the Quorum Journal Manager

hadoop大数据平台手动搭建(一)-ssh,ntp

Hadoop大数据平台个人开发环境手动搭建(CDH版本) 伪分布式

大数据平台搭建（hadoop+spark）

Spark、Hadoop大数据平台搭建

大数据 -- Cloudera Manager(简称CM)+CDH构建大数据平台大数据 -- Hadoop集群环境搭建 Linux配置ntp时间服务器（全） CDH集群手动导入scm库

手动搭建hadoop集群环境

大数据平台搭建 | Hadoop 集群搭建

spark streaming读取kakfka数据手动维护offset

纯手动搭建大数据集群架构_记录017_为RuoYi-Cloud-Plus-master添加phoenix-jdbc支持_用mybatis操作hbase---大数据之Hadoop3.x工作笔记0178

纯手动搭建大数据集群架构_记录014_安装部署phoenix_使用Squirrel胖客户端用sql来操作hbase---大数据之Hadoop3.x工作笔记0175

openstack手动搭建

react手动搭建

手动搭建docker

手动搭建springboot

kubernetes 手动搭建

手动搭建gitlab

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)