python os path join urlretrieve 文件操作 - 代码天地

python os path join urlretrieve 文件操作

企业开发 2020-03-23 14:40:15 阅读次数: 0

分析下面的操作：

import os
from urllib3 import request

class file_retrieve():
    def __init__(self):
        self.path = os.path.join(os.path.dirname(os.path.dirname(__file__)),'images')
        print(self.path)
        if not os.path.exists(self.path):
            os.mkdir(self.path)
        print(self.path)

    def process_item(self,item,spider):
        cataory = item['category']
        urls = item['urls']

        cataory_path = os.path.join(self.path,cataory)
        if not os.path.exists(cataory_path):
            os.mkdir(cataory_path)
        for url in urls:
            image_name = url.split('_')[-1]
            request.urlretrieve(url,os.path.join(cataory_path,image_name))

file_retrieve()

os.path.dirname(file) 相当于获取当前的文件的本独立路径，如果要获取到本文件的上一层路径就是 os.path.dirname(os.path.dirname(file))
self.path = os.path.join(路径,文件夹名) join就是为了拼接本地的文件夹，最后就是self.path获取到一个完成的文件夹路径 C:/Users/user/PycharmProjects\images
if not 语句就是为了判断是否为真
os.path.exists(self.path) 是说明这个文件是否存在
os.mkdir(cataory_path) 不存在就创建此文件夹
process_item(self,item,spider): 由于是在类中创建的方法，所以都有self同时在传入冲spider中来的item
image_name = url.split('')[-1] 把url通过_分割出来变成一个list，同时截取最后一位
request.urlretrieve(url,os.path.join(cataory_path,image_name)) urlretrieve 函数是说明下载url中的地址并保存到对应的文件夹中并命令名字。这样可以保证从url下载过来的文件可以放到正确的文件夹中，并保持文件名正确
urlretrieve(url, filename=None, reporthook=None, data=None) 参数filename：指定了保存本地路径（如果参数未指定，urllib会生成一个临时文件保存数据。）

猜你喜欢

转载自blog.51cto.com/zhangfang526/2481005

python os path join urlretrieve 文件操作

python的os.path.join()

python os.path.join()

python的os.path.join

Python中 os.path.join()与join()

python 文件操作 os.path.join(path, *paths) 路径合成（追加）

Python中的os.path.join()

python中使用os.path.join()

python之os.path.join

Python os.path.join使用

Python之os.path.join()

python路径拼接os.path.join()

Python的os.path.join()详解

python函数式编程/os.path.join，join区别/获取文件路径

python中的join()与os.path.join()的使用方式

Python中join函数和os.path.join用法

python中的join和os.path.join用法

Python中的os.path.join和join的区别

Python join() 方法与os.path.join()的区别

python 中的join() 和 os.path.join()

python——os.path.join() python路径拼接os.path.join()函数的用法

python 拼接路径 os 模块os.path.join()

python os.path.join() , os.path.basename() , os.path.dirname() ,os.path.split() 使用方法

os.path.join()

os.path.join

Python 文件路径path.os操作

python 编程开发 —— 系统（os 与 os.path）文件操作

python中的join( )，os.sep , os.path.join()函数

Python os.path.join和 os.sep.join的区别

Python中的 os.path.join() os.path.split()和os.path.splitext()函数区别

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)