BeautifulSoup库学习笔记 - 代码天地

BeautifulSoup库学习笔记

编程语言 2018-07-28 14:09:47 阅读次数: 0

Beautifulsoup库：该库是python语言写的，主要功能是将html、xml格式的数据对象解析成“标签树”，并进行遍历和维护。
一、通过Beautifulsoup将数据变成标签树
Beautifulsoup标签树的集中基本元素如下：
这里写图片描述
二、提取标签树中的信息
soup.标签名1 获取第一个标签名＝标签名1的整条标签信息
1、以下为查看标签、标签名、父标签、标签属性、标签的非属性字符串、标签类型、、、

2、find_all()
用来查找标签元素：soup.find_all(name,attrs,string,**kwargs)，返回一个列表类型的查找结果
soup.a.parent是tag类型的数据；soup.a.contents返回的是list类型的数据；soup.a.children返回的是一个迭代对象，只能通过for循环使用，不能直接通过索引来读取其中的内容
3、取出非子节点中的非属性字符串下图所示：
这里写图片描述
name_tag = soup.find(‘span’,itemprop=’name’)
name = name_tag2.contents[0]

猜你喜欢

转载自blog.csdn.net/weixin_42813077/article/details/81239687

BeautifulSoup库学习笔记

reauests库和beautifulsoup4库学习笔记

BeautifulSoup学习笔记1

BeautifulSoup 学习笔记

爬虫笔记（十四）——BeautifulSoup库

Beautifulsoup4库学习

Python学习笔记十：BeautifulSoup

Python学习笔记：BeautifulSoup模块

python爬虫学习笔记3：bs4及BeautifulSoup库学习

python爬虫之BeautifulSoup库程序笔记

python爬虫学习笔记四：BeautifulSoup库对HTML文本进行操作

【python爬虫学习笔记】04 BeautifulSoup库入门及信息的标记方法

吴裕雄--天生自然python学习笔记：beautifulsoup库的使用

Python爬虫学习笔记(BeautifulSoup4库：标签树的上、下、平行遍历)

Py之解析库BeautifulSoup学习

学习笔记之BeautifulSoup(1)----对象的种类

Python爬虫学习笔记(BeautifulSoup补充)

Beautifulsoup学习笔记+实战项目（绝对详细）

Python中beautifulsoup学习笔记一

Python中Beautifulsoup学习笔记二

BeautifulSoup 库

BeautifulSoup库

BeautifulSoup 笔记

BeautifulSoup学习

Python 爬虫学习04 bs库示例学习(beautifulSoup)

小白学爬虫笔记4---beautifulsoup库

python笔记解析web的库 XPath BeautifulSoup pyQuery基础

爬虫解析库BeautifulSoup的一些笔记

【python爬虫专题】解析方法 <4> BeautifulSoup库学习

python学习笔记——提取网页信息BeautifulSoup4

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)