1.spark环境搭建

其他 2018-09-25 20:44:11 阅读次数: 0

如何在linux上安装spark

首先我这里使用的是Ubuntu18.04,64位系统

安装spark之前，需要先搭建环境

1.安装jdk

我安装到了/usr/local/java目录下，然后在~/.bashrc中配置环境变量

export JAVA_HOME=/usr/local/java/jdk1.8.0_181

export PATH=$JAVA_HOME/bin:$PATH

然后source ~./bashrc

最后在终端输入java -version

显示jdk的版本是1.8.0，表示安装成功

2.安装scala

我安装到了/usr/local/scala目录下，然后在~/.bashrc中配置环境变量

export SCALA_HOME=/usr/local/scala/scala-2.12.4

export PATH=$SCALA_HOME/bin:$PATH

然后source ~./bashrc

最后在终端输入scala -version

也可以进入scala交互式环境

证明scala安装成功，scala版本是2.12.4

3.安装Hadoop

由于Spark没有HDFS，所以需要安装一下Hadoop，当然Hadoop不是唯一的选择，也可以选择其他的。

我安装到了/usr/local/hadoop目录下，然后在~/.bashrc中配置环境变量

export HADOOP_HOME=/usr/local/hadoop/hadoop-2.9.1

export PATH=$HADOOP_HOME/bin:$PATH

然后source ~./bashrc

输入hadoop version

显示版本2.9.1

这里还需要修改一些其他的配置文件，进入到$HADOOP_HOME/etc/hadoop中。

首先修改hadoop-env.sh

然后修改core-site.xml

然后修改hdfs-site.xml

然后修改mapred-site.xml，由于没有这个文件，但有mapred-site.xml.template这个文件，所以我们拷贝一份。

然后配置yarn-site.xml

配置完成

接下来格式化一下

格式化成功，看一下相应的目录

可以看到之前新建的空目录，里面已经有东西了。

如果需要密码，就输入这两行，就可以免密码登陆了

最后启动一下hadoop

ssh-keygen -t rsa -P

cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys

4.安装maven

我安装到了/usr/local/java目录下，然后在~/.bashrc中配置环境变量

export JAVA_HOME=/usr/local/java/jdk1.8.0_181

export PATH=$JAVA_HOME/bin:$PATH

输入mvn输出如下，说明安装成功

5.安装python

直接apt-get install python3即可

6.安装spark

我安装到了/usr/local/目录下，然后在~/.bashrc中配置环境变量

export SPARK_HOME=/usr/local/spark/spark-2.3.1-bin-hadoop2.7

export PATH=$SPARK_HOME/bin:$PATH

输入pyspark成功进入。

猜你喜欢

转载自www.cnblogs.com/traditional/p/9703282.html

1.spark环境搭建

1.spark简介

1.Spark介绍

1.Spark基础

1.Spark基本入门

1.spark核心RDD特点

[笔记迁移][Spark][1]Spark环境搭建

1.Spark大型电商项目-电商用户行为分析简介

Spark实战（1）_Spark2.0环境搭建

Spark电商用户行为分析（1）—— 环境搭建

spark环境搭建

Spark 环境搭建

spark 环境搭建备注

Spark-环境搭建

spark 运行环境搭建

Spark开发环境搭建

如何搭建Spark环境

Spark On YARN 环境搭建

【Spark环境搭建】

Spark Hadoop 环境搭建

①Spark入门-环境搭建

Spark集群环境搭建

Spark 开发环境搭建

Spark编程环境搭建

Spark开始 ———环境搭建

Spark 集群环境搭建

搭建Spark开发环境

【Spark学习笔记】1、Java-Maven-Spark项目环境搭建

spark (2)spark开发环境搭建

Spark(三): spark集群环境搭建

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)