python爬虫+词云图，爬取网易云音乐评论 - 代码天地

python爬虫+词云图，爬取网易云音乐评论

其他 2019-04-08 15:11:07 阅读次数: 0

爬取网易云音乐的评论

一开始是按照常规思路，分析网页ajax的传参情况。看到参数都是加密过的，在网上参考别人之前爬虫的思路。发现陆续有人用模拟传参，自己加密参数来实现，主要用python和js版本的。我尝试了几次，加密过程有问题没解决。后来突然看到有人提到了一个get请求获取评论的url，实测可以用，估计是传参之后，实际调用的内部接口。

http://music.163.com/api/v1/resource/comments/R_SO_4_167882?limit=20&offset=0

尝试之后发现可以直接调用，那么就简单多了

下面截取部分爬取的内容

解析json详情

根据url容易看出limit是每页的条数，offset是步长。随便试了几个参数，验证猜想正确。解析requests返回的json结构时，开始第一页的评论内容是hotComments，就都按照hotComments来解析。但是翻页后出错，原来后面其他页的是comments。估计是网易把历史的热门评论放到第一页，后面的是按时间倒叙的日常评论

词频统计和停止词

接下来对爬下来的txt文本进行词频统计，中文分词用的是jieba库，发现，和。等一类的无用词出现的频率也很高，于是在网上下载了一个停止词的txt文件，将一些没有的常见词过滤掉，不参与统计

扫描二维码关注公众号，回复： 5810864 查看本文章

词云图

刚开始的时候，图片里的中文是乱码，但是英文可以正常显示。后来发现是要加上font_path='Hiragino Sans GB.ttc'，不然中文字体不能正常显示，英文字体则可以直接支持。

源码如下

猜你喜欢

转载自blog.csdn.net/qq_40925239/article/details/89069608

python爬虫+词云图，爬取网易云音乐评论

【2019.05】python 爬取网易云音乐评论（热门评论和全部评论）绘制词云图【大碗宽面】

python爬虫爬取网易云音乐的热门评论

【Python】爬虫-----爬取网易云音乐评论信息

Python爬虫实战 | 爬取网易云音乐评论

python爬取网易云音乐评论

网易云音乐评论爬虫:爬取歌曲的全部评论

【爬虫Practice5】爬取网易云音乐评论

爬取网易云音乐评论！python 爬虫入门实战（六）selenium 入门！

python selenium 爬取网易云音乐歌曲评论

python爬取网易云音乐歌曲评论信息

python+selenium 爬取网易云音乐评论

python爬取网易云音乐歌曲评论

爬取网易云某歌曲所有评论，并输出词云图

爬取网易云音乐评论

爬取网易云音乐精彩评论

网易云音乐评论爬取

爬取网易云音乐榜单第一歌曲的热门评论并制作成词云

爬取《鸡你太美》网易云音乐评论并生成词云

网易云音乐评论爬虫（三）:爬取歌曲的全部评论

python网络爬虫-爬取云音乐评论（3）

python网络爬虫&&爬取网易云音乐

[爬虫]Python爬取网易云音乐搜索并下载歌曲!

Python爬取网易云音乐热歌榜（爬虫）

Scrapy爬取网易云音乐和评论（五、评论）

Python 网易云音乐评论爬虫

爬虫练习：爬取网易云音乐热歌榜全部歌曲的热门评论

【Python实战】爬取网易云音乐用户听歌排行，来制作一张Ta最爱歌手的词云图

python 爬取视频评论生成词云图

爬取网易云音乐评论并使用词云展示

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)