Python3批量下载.dat和.hea文件 - 代码天地

Python3批量下载.dat和.hea文件

其他 2018-11-22 14:40:10 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/weifuliu/article/details/82908551

在杭州电子科技大学的读研的哥哥研究项目需要在一个网站上下载数据进行数据分析，总共4000多份文档数据，若是手工点击链接下载的话，不知道要下载到猴年马月了，还好我哥知道我会爬虫，嘿嘿，这时候就该展现我Python爬虫威力了。

数据存放的地址

代码

#https://physionet.org/physiobank/database/hbedb/BDS00001.dat

import requests
from bs4 import BeautifulSoup
import re
import os
import urllib


def getHTMLText(url):
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        return "产生异常"

def getBat(html):
    reg = r'href=".*.bat"'
    imgre = re.compile(reg) 
    imglist = re.findall(imgre, html)
    return imglist


if __name__=="__main__":
    lst=[]
    url="https://physionet.org/physiobank/database/hbedb/"
    text=getHTMLText(url)
    soup=BeautifulSoup(text,"html.parser")
    files=soup.find_all('a')
    for i in files:
        try:
            href=i.attrs['href']
            lst.append(re.findall(r'BDS.*.hea',href)[0])
        except:
            continue
    for l in lst:
        link="https://physionet.org/physiobank/database/hbedb/"+l
        ff=requests.get(link)
        print(link+"正在下载")
        try:
            f = open('C:\\Users\\Administrator\\Desktop\\lwf\\Spider\\csdn\\hea\\'+ str(l), 'wb')
            f.write(ff.content)
            f.close()
        except Exception as e:
            print("失败")

效果图
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weifuliu/article/details/82908551

Python3批量下载.dat和.hea文件

使用python3批量下载rbsp数据

使用python3批量下载网站图片

python3批量为文件重命名

Python3批量转换文件编码

python3批量抓取电影天堂下载链接

Python3批量修改文件名脚本

Python3批量修改文件名小工具

python3批量telnet脚本

Python3批量处理域名解析

Python3批量合并excel 格式xlsx和xls都行

20230809在WIN10下使用python3批量将TXT文件转换为SRT文件

20230507使用python3批量转换DOCX文档为TXT

1.上传文件到服务器；2批量文件下载；3单个文件下载

[云炬python3玩转机器学习笔记] 2-4批量学习、咋西安学习、参数学习和非参数学习

20230508在Ubuntu22.04下使用python3批量转换DOCX文档为TXT

20230811在WIN11下使用python3批量将中英文的SRT格式的字幕合并

网页视频解密下载 TS解密下载 M3U8批量下载

猫抓+M3U8批量下载合并

urllib3批量下载百度图片

Python3.根据ID3v2批量修改mp3文件名

mybatis3批量更新批量插入

Python3学习笔记（十八）：文件上传和下载

Python基础小程序_02批量重命名文件

7.6批量下载网易云歌曲

Python3 根据m3u8下载视频，批量下载ts文件并且合并

MP3批量压缩体积工具

mp3批量剪切

struts2批量上传文件

renamer 6批量处理文件重命名

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)