Beautiful Soup提供一些简单的、python式的函数,用来处理导航、搜索、修改分析“标签树”等功能。
它是一个工具箱,通过解析文档为用户提供需要抓取的数据,
它自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。
beautifulsoup4安装
验证安装:
from bs4 import BeautifulSoup
soup = BeautifulSoup(‘
Hello
’,‘html.parser’)print(soup.p.string)
执行结果如下:
Hello