在centos6.5上hadoop mapreduce 统计英文单词

其他 2019-04-10 16:01:11 阅读次数: 0

版权声明：本文为博主原创文章，大家可以转载分享学习 https://blog.csdn.net/qq_31469369/article/details/79878130

在centos6.5上hadoop python实例统计英文单词

linux上的单词删选实例

安装的是centos6.5系统，搭建hadoop集群
统计一篇文章中英文单词的数量

统计1.txt中单词的数量，新建一个mds目录，把文件移到此目录下

a.写一个shell脚本
新建一个run.sh文件并编辑

HADOOP_CMD=”/usr/local/src/hadoop-1.2.1/bin/hadoop”
STREAM_JAR_PATH=”/usr/local/src/hadoop-1.2.1/contrib/streaming/hadoop-streaming-1.2.1.jar”
INPUT_FILE_PATH_1=”/The_Man_of_Property.txt” //这是配置mapreduce的输入
OUTPUT_PATH=”/output” //指定一个输出路径

$HADOOP_CMD fs rmr -skipTrash$ OUTPUT_PAHT

Step .

$HADOOP_CMD jar$ STREAM_JAR_PATH\ //输入
-input $INPUT_FILE_PAHT_1 \ -output$ OUTPUT_PATH \
-mapper “python map.py” \
-reduce “python red.py” \
-file ./map.py \
-fiel ./red.py
脚本如圖所示：

执行 ./bin.hadoop fs -ls 查看hdfs的文件
把需要操作的文件01.txt放到文件系统中
上传：
hadoop fs -put 01.txt / 上传文件
hadoop环境变量需要配置，并在权限下操作root
hadoop fs -ls / 查看文件列表可以查看到01.txt则上传成功

QQ截图20180409160541.png-30.2kB

    不多说，直接运行脚本 
bash run.sh

QQ截图20180410102910.png-78.7kB
打开浏览器查看hdfs （浏览器是linux自带，window浏览器需要在在电脑配置）
浏览器 master:50030
QQ截图20180410103117.png-24kB
QQ截图20180410103153.png-51.4kB

点击查看运行成功

我们可以把输出的结果当到本地
查看hdfs输出目录
hadoop fs -ls
QQ截图20180410105846.png-12.3kB

QQ截图20180410105910.png-18.2kB

QQ截图20180410105930.png-20.4kB

QQ截图20180410105942.png-17.5kB
查看输出结果成功

猜你喜欢

转载自blog.csdn.net/qq_31469369/article/details/79878130

在centos6.5上hadoop mapreduce 统计英文单词

Hadoop实战——MapReduce对英文单词文本进行统计和排序（超详细教学，算法分析）

利用Hadoop MapReduce实现单词统计——Wordcount

英文单词个数的统计

统计英文单词次数

英文单词词频统计

飘英文单词统计

(四)利用Hadoop MapReduce 实现文本单词频率统计

HADOOP(1)__Mapreduce_WordCount统计单词数

(11) Hadoop Java 实现MapReduce HelloWord 单词统计

hadoop使用MapReduce统计单词出现次数案例

MapReduce实现单词统计

MapReduce单词统计

Java -- 客户端利用Hadoop集群上的MapReduce统计文本中单词的出现次数

哈利波特英文单词统计频率

英文单词个数统计及排序

MapReduce实例——wordcount（单词统计）

MapReduce实现单词统计案例

统计单词出现次数的mapreduce

MapReduce单词统计案例，WordCount

MapReduce 单词统计案列

Hadoop之MapReduce过程，单词计数WordCount

MapReduce之WordCount单词计数（上）

3.3 Hadoop-MapReduce，统计温度

3.2 Hadoop-MapReduce，统计词数

Hadoop MapReduce 上的 WordCount

Hadoop 7days-3 MapReduce 以及统计单词出现的次数小练习

(13) Hadoop Java 实现MapReduce HelloWord 单词统计更新版 2

(12) Hadoop Java 实现MapReduce HelloWord 单词统计更新版

【实战演练】大数据系列01-Hadoop安装&使用MapReduce实现单词统计

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)