学习笔记:从0开始学习大数据-31. pig安装运行 - 代码天地

学习笔记:从0开始学习大数据-31. pig安装运行

编程语言 2018-12-17 08:50:50 阅读次数: 0

继续扫盲，今天尝试pig的安装使用

Apache Pig 是一个高级过程语言，适合于使用 Hadoop 和 MapReduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 SQL 的查询，Pig 可以简化 Hadoop 的使用。
使用pig，可以不用编写java程序，用几句简单的命令就处理复杂的java编程才能完成的MapReduce程序

1.下载
http://pig.apache.org/releases.html#19+June%2C+2017%3A+release+0.17.0+available
我下载的是最新版本 pig-0.17.0.tar.gz

2.解压
tar -zxvf pig-0.17.0.tar.gz

3.配置
无需配置，按默认设置就可运行，为了方便使用，可以修改 /etc/profile文件，加入：
export PIG_HOME=/home/linbin/software/pig-0.17.0
export PIG_CLASSPATH = $HADOOP_HOME/etc/hadoop
export PATH=$PATH:$PIG_HOME/bin

让设置生效：
source /etc/profile
另外，根据需要修改配置文件 pig-0.17.0/conf/pig.properties 都按默认值也能测试运行

4.测试
[root@centos7 bin]# pig -version
Apache Pig version 0.17.0 (r1797386)
compiled Jun 02 2017, 15:41:58

5. 执行
Apache Pig脚本可以通过三种方式执行，即交互模式，批处理模式和嵌入式模式。
交互模式是shell模式，批处理是脚本提交模式，嵌入式是定义函数模式。
另外在使用Grunt shell时，通过“-x"选项以所需的模式（local/MapReduce）（即本地模式，hadoop模式）调用
local本地模式
[root@centos7 bin]# pig -x local
...
grunt>

MapReduce模式
先启动hadoop,然后：
[root@centos7 bin]# pig -x mapreduce
...
grunt>

7.使用教程
教程网址： https://www.w3cschool.cn/apache_pig/apache_pig_overview.html

猜你喜欢

转载自blog.csdn.net/oLinBSoft/article/details/85041193

学习笔记:从0开始学习大数据-31. pig安装运行

MongoDB学习笔记(一)：下载安装运行

Elasticsearch学习笔记（一）-- Elasticsearch 的安装运行与简单使用

ionic小白的学习路之安装运行篇

学习笔记:从0开始学习大数据-19. storm开发及运行环境部署

学习笔记:从0开始学习大数据-8.直接在Eclipse配置运行MapReduce程序

学习笔记:从0开始学习大数据-18.kettle安装使用

学习笔记:从0开始学习大数据-17.Redis安装及使用

学习笔记:从0开始学习大数据-16. kafka安装及使用

学习笔记:从0开始学习大数据-15. Flume安装及使用

学习笔记:从0开始学习大数据-12. spark安装部署

学习笔记:从0开始学习大数据-11. sqoop安装部署

学习笔记:从0开始学习大数据-10. hive安装部署

学习笔记:从0开始学习大数据-3.Eclipse安装

学习笔记:从0开始学习大数据-2.hadoop安装

学习笔记:从0开始学习大数据-6.hbase安装

学习笔记:从0开始学习大数据-27. solr安装使用

学习笔记:从0开始学习大数据-25. impala 安装及使用

学习笔记:从0开始学习大数据-22. R语言recharts等lib库的安装及使用

学习笔记:从0开始学习大数据-21. R语言及Rstudio IDE的安装

学习笔记:从0开始学习大数据-1.centos7安装

学习笔记:从0开始学习大数据-26. Hue安装

Redis(一) Redis安装运行和数据操作

Pig 安装总结学习

saltstack学习之一：服务架构以及相关配置安装运行

RedisJSON学习记录（一）—— 环境搭建（Docker安装运行RedisJSON）

Docker | Docker安装运行Mysql 5.7.31容器并修改数据库密码

车道线检测laneatt算法实战CULane Datasets、Tusimple数据集——安装运行训练步骤

play 安装运行

安装运行kafka

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)