我与“爬虫”的“爱之初体验” - 代码天地

我与“爬虫”的“爱之初体验”

其他 2020-05-03 17:09:22 阅读次数: 0

1.主题：西游记小说网站爬取

图片如下

2.源代码：

import requests
from bs4 import BeautifulSoup
url='http://www.eywedu.com/Xiyou/01/index.htm'
r=requests.get(url)
r.raise_for_status()
r.encoding=r.apparent_encoding
txt=r.text
soup=BeautifulSoup(txt,'html.parser')
ls=[]
for item in soup.find_all('a'):
ls.append(item)
print(ls)

3.爬取效果

4.问题

个人水平极度有限，在本专业叶栩同学的帮助下，勉勉强强爬出来一些！说实话还是有点窃喜哈哈哈。

另外，由于水平过低，无法提取出文本，询问同学过后，可在代码后添加print(i.text)。尝试无果，期待大神解答！

猜你喜欢

转载自www.cnblogs.com/houyixuan/p/12822437.html

我与“爬虫”的“爱之初体验”

专辑一：爱之初体验(中级)

[ZYNQ入门宝典]爱之初体验

【AOP系列】爱之初体验(一)

Java程序员从笨鸟到菜鸟之（八十五）跟我学jquery（一）爱之初体验jquery

深度学习算法(第1期)---- TensorFlow爱之初体验

MQTT之ESP8266 OTA固件升级-坎坷记（FOTA爱之初体验）

Nginx之初体验

keepalived之初体验

python之初体验

Spring之初体验

Vue之初体验

MySQL之初体验

RecyclerView之初体验 - - !

博客之初体验

mock之初体验

Go之初体验

递归之初体验

WebService之初体验

git之初体验

flask之初体验

Gradle 之初体验

python3---我的代码库之初体验

Spring Security 之初体验

SpringBoot之初体验（一）

线程之初体验

IPFS实践之初体验

jsp页面之初体验

Android EventBus之初体验

flume搭建之初体验

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)