Hadoop大作业

其他 2018-05-18 00:36:43 阅读次数: 8

---恢复内容开始---

1.用Hive对爬虫大作业产生的文本文件（或者英文词频统计下载的英文长篇小说）进行词频统计。

先启动Hadoop。

jps查看各个服务已启动，进入hive

把本地文件上传到hdfs文件系统（这里本来是打算把预先准备的英文小说上传上去，但是不知道为什么一直提示找不到文件，然后发现帮助文档和注意文档的内容量也不小，所以直接拿来做词频统计也是不错的。）

建个表docs

把hdfs文件系统中input文件夹里的文本文件load进去,写hiveQL命令统计

统计成功提示

使用select命令查看结果（这里的词条太多了，windows平台无法截长屏，所以只截了一小部分的结果和统计条数）

2.用Hive对爬虫大作业产生的csv文件进行数据分析，写一篇博客描述你的分析过程和分析结果。

暂时还不会

猜你喜欢

转载自www.cnblogs.com/jiesheng/p/9054028.html

Hadoop大作业

Hadoop综合大作业

Hadoop 综合大作业

【Hadoop】Hadoop综合大作业

作业——12 hadoop大作业

Hadoop综合大作业 Hadoop综合大作业

hadoop综合大作业1

Hadoop综合大作业&补交作业

菜鸟学IT之Hadoop综合大作业

Hadoop综合大作业&补交两次作业

大数据应用期末总评Hadoop综合大作业

大数据应用期末总评（hadoop综合大作业）

【大数据应用期末总评】Hadoop综合大作业

大作业

【大数据应用技术】作业十二｜Hadoop综合大作业

爬虫大作业爬虫大作业

python大作业

爬虫大作业

爬虫大作业（修改）

爬虫大作业

爬虫大作业02

大作业项目

期末综合大作业

大作业分析

王者大作业总结

课程大作业

大作业之zabbix

javase大作业反思

周末大作业

三大作业

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)