Python实现断点续传下载文件,大文件下载还怕下载到一半就断了吗?不存在!

这篇博客简单介绍python断点续传下载文件,并加入花哨的下载进度显示方法,涉及Python文件操作的技巧,和一些函数库的使用。

环境

Python 3.6
requests模块
对应文件的下载链接 (要下载的文件必须支持断点续传
(是不是很少东西?那必须,python就是这么强大!)

干货

下面直接上代码,关键是简单易懂,复制就能用,拿走不谢。

import sys
import requests
import os

# 屏蔽warning信息
requests.packages.urllib3.disable_warnings()

def download(url, file_path):
    # 第一次请求是为了得到文件总大小
    r1 = requests.get(url, stream=True, verify=False)
    total_size = int(r1.headers['Content-Length'])

    # 这重要了,先看看本地文件下载了多少
    if os.path.exists(file_path):
        temp_size = os.path.getsize(file_path)  # 本地已经下载的文件大小
    else:
        temp_size = 0
    # 显示一下下载了多少   
    print(temp_size)
    print(total_size)
    # 核心部分,这个是请求下载时,从本地文件已经下载过的后面下载
    headers = {'Range': 'bytes=%d-' % temp_size}  
    # 重新请求网址,加入新的请求头的
    r = requests.get(url, stream=True, verify=False, headers=headers)

    # 下面写入文件也要注意,看到"ab"了吗?
    # "ab"表示追加形式写入文件
    with open(file_path, "ab") as f:
        for chunk in r.iter_content(chunk_size=1024):
            if chunk:
                temp_size += len(chunk)
                f.write(chunk)
                f.flush()

                ###这是下载实现进度显示####
                done = int(50 * temp_size / total_size)
                sys.stdout.write("\r[%s%s] %d%%" % ('█' * done, ' ' * (50 - done), 100 * temp_size / total_size))
                sys.stdout.flush()
    print()  # 避免上面\r 回车符


if __name__ == '__main__':
    link = r'https://api.gdc.cancer.gov/data/'
    UUID = r'2a4a3044-0b1a-4722-83ed-43ba5d6d25b0'
    path = r'F:\SYY\temp\a.txt'
    url = os.path.join(link, UUID)
    # 调用一下函数试试
    download(url, path)

相关博客链接:https://blog.csdn.net/qq_35203425/article/details/80987451
代码和上面一篇博客很相似,只不过加入了断点续传,所有的代码解释也都能在前面那篇博客找到。

下面演示一遍:
这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_35203425/article/details/80987880