python爬虫入门(解析)

其他 2018-05-09 15:02:30 阅读次数: 4

根据上一篇的转载进行的总结:

python爬虫的主要步骤

1.访问网站,获取html数据

2.读取html数据,解析数据,取出你想要的值

解析数据使用beautifulsoup

解析数据的步骤详解:

1. 用beautifulsoup将html数据解析成一个对象

soup = BeautifulSoup(html_text, "html.parser")  # 创建BeautifulSoup对象

2.通过soup对象,获取标签内容

myHead=soup.head #获取第一个<head>标签

myBody=soup.body #获取第一个<body>标签

myBody=soup.b #获取第一个<b>标签

myPara= day.find_all('p') # 获取所有p标签

3.通过标签对象,获取文本

text=myPara.string

4.div嵌套div,不好定位,就用find_all获取

data = body.find_all('div', {'class': 'weather_li_left'})
print(data)

5.获取标签下的所有 <li> 标签,并且输出子标签的文本

child=parent.find_all('li')
for text in child:
    print(text.string)

猜你喜欢

转载自542255641.iteye.com/blog/2397385

python爬虫入门(解析)

python 爬虫入门解析

python爬虫入门 ✦ unescape解析

python网络爬虫入门（三、复杂HTML的解析）

小白学 Python 爬虫（23）：解析库 pyquery 入门

Python教程：网络爬虫快速入门实战解析

从入门到放弃：python爬虫系列-xpath解析库的使用

Python爬虫入门 - 规则、框架和反爬策略解析

python爬虫--数据解析

python爬虫解析json

Python爬虫：xpath解析

python爬虫-xpath解析

Python爬虫——正则解析

python爬虫入门教程(三)：淘女郎爬虫 ( 接口解析 | 图片下载 )

Python爬虫入门(1)---爬虫概述，request请求库，BeautifulSoup解析库

python爬虫-入门-了解爬虫

爬虫入门二（数据解析）

Python爬虫入门教程 87-100 glidedsky网站爬虫解析，爬虫闯关第一篇

python 爬虫入门

python-爬虫入门

(转载)python爬虫入门

Python爬虫入门：综述

python爬虫入门

python爬虫_入门_翻页

python　爬虫入门

python 爬虫入门

Python爬虫入门项目

python爬虫入门（1）

怎样入门python爬虫？

Python爬虫入门指导

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)