爬取博客园内容出现获取不到内容

爬取博客园内容时出现前5页内容可获取,后面内容无法获取现象

通过输出爬取异常的页面了解到,博客园对于未登录用户不开放全部阅读权限

解决办法:在head中加入登陆后网页的cookie即可

猜你喜欢

转载自www.cnblogs.com/lixv2018/p/12343593.html
今日推荐