爬虫—历史天气预报资料爬取 - 代码天地

爬虫—历史天气预报资料爬取

其他 2018-05-25 20:42:10 阅读次数: 1

爬取某一年哈尔滨市的天气预报信息。
网址
需要爬取2016年整年的资料。

import urllib.request
from bs4 import BeautifulSoup
import pandas as pd

# URL list for crawler:

'''
http://lishi.tianqi.com/haerbin/201601.html
......
http://lishi.tianqi.com/haerbin/201612.html

'''

URList=['http://lishi.tianqi.com/haerbin/2016'+str(i).zfill(2)+'.html' for i in range(1,13)]
label=[]
con_in=[]
con_all=[]

for url in URList:   
    content = urllib.request.urlopen(url).read().decode('gbk')  #获取HTML
    soup = BeautifulSoup(content,'html.parser')  #解析
    tempall=soup.select('.tqtongji2')   #定位到要爬取信息的类
    uls=tempall[0].findAll('ul')        #再进一步精确定位
    if label==[]:
        lis=uls[0].findAll('li')
        for li in lis:
            label.append(li.text)
    for ul in uls[1:]:
        lis=ul.findAll('li')
        for li in lis:
            con_in.append(li.text)
        con_all.append(con_in)
        con_in=[]
df = pd.DataFrame.from_records(con_all, columns=label)
df.to_csv('forecast_info_Harbin.csv')

猜你喜欢

转载自blog.csdn.net/maverick_7/article/details/79464061

爬虫—历史天气预报资料爬取

python爬虫-爬取天气预报内容

爬取天气预报内容

python 爬取天气预报

python爬取网页天气预报

deqin -深度爬取天气预报

ziheng - 爬取天气预报

写一个爬取中国天气网的终端版天气预报爬虫

Python爬虫入门实战--------一周天气预报爬取

Python爬虫学习：用API爬取天气预报数据

【爬虫学习二】 python通过API爬取各城市天气预报数据

使用python爬取天气预报，[python入门案例]

和风api爬取天气预报数据

python利用xpath爬取天气预报信息

python爬取天气预报用163邮箱发

bs4库爬取天气预报

python爬虫爬取厦门历史天气

天气预报：天气数据集爬取 + 可视化 + 13种模型预测

Python：爬取天气并设计制作天气预报对话框

runze - 学习爬去天气预报

python爬虫----全国天气预报的获取

python学习之路——爬虫天气预报

python爬虫之天气预报网

手撸爬虫（天气预报）

Python爬取南京市往年天气预报，使用pyecharts进行分析

Python实现定时爬取未来15天的天气预报存入Mysql数据库

爬取天气预报”温州未来30天最高温“

Python番外篇：selenium+matplotlib 爬取天气预报制作温度折线图

python爬取天气预报数据，并实现数据可视化

Flask+echarts爬取天气预报数据并实现可视化

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)