【python】获取历史天气数据

编程语言 2023-05-05 20:07:49 阅读次数: 0

记录一下我的python学习之路
今天没有使用爬虫获取数据，而是根据目标网页的数据特点，选用pd.read_html()读取网页表格类数据。

目录

前期准备
完整代码
代码浅析
欢迎相互学习

前期准备

环境：python环境3.多版本，需要用到的库主要有openpyxl，。pandas(用于保存数据)。
目标网站：2345天气王中的历史天气
在这里插入图片描述

在写完这篇博文后，我还去网上搜索了相关爬取方式，发现还有许多相似或者更加简介的方式，这里贴出来供大家学习。路漫漫其修远兮~

参考博文：【Python奇淫技巧】用pandas的read_html函数仅一行代码实现网页爬虫

注意：在对各大网站进行浏览时，要避免短时间内多次对对方服务器多次请求。这也是尊重对方所提供的数据，不能恩将仇报。

完整代码

代码包括读取网页信息，还将数据直接存储到excel表格中。

# import lxml
from openpyxl import load_workbook
import pandas as pd
url = "https://tianqi.2345.com/wea_history/58453.htm"#目标网址
tables = pd.read_html(url)[0]
#准备存储
workbook = load_workbook(filename='数据.xlsx')#打开表格
sheet = workbook.create_sheet('天气')#创建表格
sheet.append(list(tables))#表格的标头
i=0
for line in range(0,len(tables.iloc[:,1])):#分别读取每一行
    print(list(tables.iloc[i, :]))#打印查看
    txt = list(tables.iloc[i, :])
    sheet.append(list(txt))
    i=i+1
workbook.save(filename="数据.xlsx")#保存表格

代码浅析

这里需要说明的是，pd.read_html(url)只能针对网页上有’<table’>标签的数据。
在最上面的图片中，我们可以看到页面上是有一个表格数据的，直接使用pd.read_html(url)就可以读取网页上的表格数据。

资料显示：
Pandas可以直接用DataFrame生成HTML表格，同样可以读取HTML文件。
read_html()函数解析HTML页面，寻找HTML表格。
如果找到，就将其转换为可以直接用于数据分析的DataFrame对象。

这功能可以说是很强大了呀。

欢迎相互学习

猜你喜欢

转载自blog.csdn.net/CBCY_csdn/article/details/125735198

【python】获取历史天气数据

python获取天气数据

获取历史天气数据，数据挖掘必备_python 大数据

Python网络爬虫--历史天气数据采集

java获取实时天气数据---免费

通过爬虫，获取天气数据

2018-7-12python爬取历史天气数据

python + docker, 实现天气数据从FTP获取以及持久化（三）-- python获取FTP数据

获取天气数据 (根据天气接口返回的数据)

python取得当前的天气数据

groovy爬虫爬取城市历史天气数据

爬虫爬取全国历史天气数据

Python爬取中国天气网天气数据

python + docker, 实现天气数据从FTP获取以及持久化（一）

Python获取天气数据，做可视化分析，毕设必备项目

爬虫-天气数据

使用SmartWeatherAPI多线程并发获取天气数据

TCP调试助手获取天气数据

跨域的几种方式-以获取天气数据为例

STM32天气数据获取

使用chatGPT开发获取格点天气数据

利用python的bs4和selenium库结合实现动态页面的爬取（爬取天气网上面的历史天气数据）

python + docker, 实现天气数据从FTP获取以及持久化（二）-- python操作MySQL数据库

python + docker, 实现天气数据从FTP获取以及持久化（五）-- 利用 Docker 容器化 Python 程序

python读取txt天气数据并使用matplotlib模块绘图

Python爬取真气网天气数据

Python爬取天气数据及可视化分析

python爬虫爬取网页上的天气数据

Python3抓取并分析天气数据

Python爬取天气数据及可视化分析！

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)