☞ ░ 老猿Python博文目录:https://blog.csdn.net/LaoYuanPython/article/details/98245036 ░
一、引言
在前面章节介绍爬取CSDN文章内容,使用的都是HTTP GET方法,返回内容可以通过BeatifulSoap进行快速解析,本节介绍的获取博文评论以及提交新评论,需要使用到HTTP的POST方法,返回数据是纯文本格式,需要使用非SOAP的方法进行解析。
二、博文评论区留言内容获取
2.1、请求获取评论区内容的HTTP请求
要通过爬虫获取博文的评论信息,首先需要获得评论信息相关的HTTP请求及响应,在启动开发者模式并用浏览器刷新页面后,会捕获一系列的HTTP访问和应答。如图:
上面红色圈标记的是博文内容的刷新触发的,但在其应答报文中并没有找到评论内容的报文信息&