记一次极其艰难的爬虫作业 - 代码天地

记一次极其艰难的爬虫作业

其他 2020-05-03 17:59:26 阅读次数: 0

最最最开始，我内心很淡定，词云都做了，这些都是毛毛雨啦～然后，生活就狠狠地打了我的脸……爬不出来，各种各样形形色色的奇怪问题都出来了，最终出来了结果(爬文章比爬网页要容易)下面就是代码：

import requests
from bs4 import BeautifulSoup
url="http://politics.gmw.cn/2020-05/03/content_33801674.htm"
r=requests.get(url)
r.raise_for_status()
r.encoding=r.apparent_encoding
txt=r.text
ls = []
soup = BeautifulSoup(txt,"html.parser")
for tag in soup.find_all('p'):
ls.append(tag)
print(ls)

然后就爬出来了

猜你喜欢

转载自www.cnblogs.com/eveya/p/12822648.html

记一次极其艰难的爬虫作业

记一次艰难的重装系统

记一次异常艰难的域靶场渗透

PAT 1013求解——记一次艰难的AC过程

记第一次爬虫

记一次爬虫实现

记一次极其坑爹的Maven无法下载相关Jar包的问题：IDEA问题

【渗透实战】记一次艰难的内网漫游之旅_拿下472台主机shell！

【实战3】记一次内网中反弹shell的艰难历程

记一次艰难的多节点YXcms靶场内网渗透

记一次艰难的 Ubuntu 双系统安装过程及问题的解决

记一次win10系统下安装Eclipse的艰难过程

一次艰难debug的反思

一次艰难的TP渗透测试

记一次python2-certbot-nginx的艰难安装（rhel7/centos7）

记一次灰常灰常艰难的利用永恒之蓝漏洞实现的内网多节点靶场渗透

记亚太数模前的一次作业

记一次实验作业获取远程桌面

记一次python游戏编程作业

记一次微信公众号爬虫的经历

记一次简单爬虫(豆瓣/dytt)

记一次不正经的爬虫经历

记一次不正经的爬虫学习经历

一次作业

一次艰难的web service对接开发

一次异常艰难的bug排查之旅

【Python】一次艰难的 python 绿色化经历

一次艰难的优化Codeforces contest/810/problem/C

记录一次艰难的onnxtuntime源码编译过程

网络安全：一次艰难的 WAF 绕过

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)