BeautifulSoup库的四种常见对象

1、Tag:
Tag通俗点讲就是HTML中的一个个标签。我们可以利用soup加标签名轻松地获取这些标签的内容,这些对象的类型是bs4,element.Tag
但是注意,它的查找方式是所有内容中的第一个符合要求的标签
2、NavigableString:
如果拿到标签后,还想获取标签中的内容。那么可以通过tag.string获取标签中的文字

3、BeautifulSoup:
BeautifulSoup对象表示的是一个文档的全部内容,大部分时间可以把它当做Tag对象,它支持遍历文档树和搜索文档树中描述的大部分方法

4、Comment:
Tag,NavigableString,BeautifulSoup几乎覆盖了html和xml中的所有内容,但是还有一些特殊对象,容易让人担心的内容是文档的注释部分
Comment对象是一个特殊类型的NavigableString对象

发布了54 篇原创文章 · 获赞 26 · 访问量 6189

猜你喜欢

转载自blog.csdn.net/qq_37662827/article/details/103016630