利用Hadoop运行第一个程序，计算文章中不同单词数量 - 代码天地

利用Hadoop运行第一个程序，计算文章中不同单词数量

其他 2018-08-29 00:57:13 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/CSDN_fzs/article/details/78993920

今天通过Hadoop来运行第一个程序，来统计一篇文章中不同英文单词的个数。

1.创建一个 t1.txt 文件夹，并将你要统计的文章粘贴进去。（这里是将txt文件创建在E盘中，跟Hadoop文件同处于一个盘）

2.在命令提示符下 Hadoop-2.7.3\sbin 中输入 start-all.cmd 开启Hadoop服务

3.准备输入、输出文件夹，在HDFS文件系统中创建。

Hadoop中所有的数据都必须放在HDFS文件系统中进行处理。

命令提示符中 Hadoop-2.7.3\sbin 下输入 hadoop fs -mkdir hdfs://localhost:9000/test/input(创建文件夹，localhost:9000为hdfs的系统目录，test和input是现在要创建的文件名)

输入 hadoop fs -ls hdfs://localhost:9000/test/ 查看文件是否创建成功

4.上传需要统计的 t1 文件到 hdfs://localhost:9000/test/input 上

hadoop fs -put E:\t1.txt hdfs://localhost:9000/test/input

5.下载 https://pan.baidu.com/s/1cmBJ7S中的 wordcount.jar 到E盘中。

wordcount.jar是Java编写的一个MapReduce计算单词数量的程序

6. 在jar包所在的路径，执行以下命令 hadoop jar wordcount.jar hdfs://localhost:9000/test/input hdfs://localhost:9000/test/output，运行命令之后，显示如下

7. hadoop fs -ls hdfs://localhost:9000/test/output查看结果文件

8. hadoop fs -cat hdfs://localhost:9000/test/output/patr-r-00000查看输出结果

9. hadoop fs -get hdfs://localhost:9000/test/output/patr-r-00000 下载计算结果到本地

猜你喜欢

转载自blog.csdn.net/CSDN_fzs/article/details/78993920

利用Hadoop运行第一个程序，计算文章中不同单词数量

第一个Hadoop程序-单词计数

终于成功运行第一个Hadoop程序

第一个Hadoop程序

Hadoop的第一个程序

计算单词数量

在IDEA中运行第一个scala程序

hadoop学习---运行第一个hadoop实例

Hadoop 第一个Hadoop程序

如何用hadoop运行第一个程序（纯新手教程）

Hadoop从安装完成到第一个程序WorldCount的完美运行

Hadoop第一个测试实例WordCount的运行

hadoop第一个运行实例wordcount

python小程序——统计文件中第一个单词出现的次数

利用Android Studio运行第一个flutter程序

Hadoop的搭建和第一个Hadoop小项目：单词计数

第一个hadoop程序-WordCount

Hadoop第一个程序wordcount

hadoop的第一个hello world程序（wordcount）

运行第一个ruby程序

【SpringCloud Netflix】运行第一个Eureka程序

mac运行第一个c程序

运行第一个Hello world！程序

1.1 运行第一个ROS程序

Docker 之运行第一个程序

node运行的第一个helloWorld程序

Spark运行第一个Scala程序WordCount

运行第一个MapReduce程序

Java||运行第一个JAVA程序

怎么在 Goland 运行自己的第一个程序？

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)