python爬虫库——urllib常用函数 - 代码天地

python爬虫库——urllib常用函数

企业开发 2024-11-01 19:02:59 阅读次数: 0

URL拆分与合并

urllib.parse.urlparse(url='') # 将URL解析为六部分：<scheme>://<netloc>/<path>;<params>?<query>#<fragment>
urllib.parse.urlparse(url='', scheme='') # 设置URL协议
urllib.parse.urlparse(url='', allow_fragments=False) # 将‘fragment’部分解析为‘path’、‘params’或‘query’的一部分
urllib.parse.urlunparse(components=('scheme', 'netloc', 'path', 'params', 'query', 'fragment')) # 使用六部分信息构造URL
urllib.parse.urlsplit(url='') # 将URL解析为五部分：<scheme>://<netloc>/<path>?<query>#<fragment>
urllib.parse.urlsplit(url='', scheme='') # 设置URL协议
urllib.parse.urlsplit(url='', allow_fragments=False) # 将‘fragment’部分解析为‘path’或‘query’的一部分
urllib.parse.urlunsplit(components=('scheme', 'netloc', 'path', 'query', 'fragment')) # 使用五部分信息构造URL
urllib.parse.urljoin(base='', url='') # 将‘base_url’解析为四部分：<scheme>://<netloc>/<path>#<fragment>，使用‘scheme’、‘netloc’、‘path’三部分内容，对新URL缺失部分进行补充
urllib.parse.urljoin(base='', url='', allow_fragments=False) # 将‘fragment’部分解析为‘path’的一部分

字典和URL参数转换

urllib.parse.urlencode(query={}) # 将字典转换为GET请求参数‘query’
urllib.parse.parse_qs(qs='query, str') # 将GET请求参数‘query’转换为字典
urllib.parse.parse_qsl(qs='query, str') # 将GET请求参数‘query’转换为由元组组成的列表

文本和URL编码转换

urllib.parse.quote(string='') # 将中文字符转换为URL编码格式
urllib.parse.unquote(string='') # 将URL编码格式解码为中文字符

猜你喜欢

转载自blog.csdn.net/guanxxx/article/details/138419885

python爬虫库——urllib常用函数

python爬虫常用库之urllib详解

python爬虫——urllib库

python爬虫，Urllib库

Python 爬虫 ---- urllib 库

【python】urllib库（爬虫）

【Python爬虫】urllib库的使用

Python爬虫---urllib库介绍

python爬虫之urllib库

讲解Python爬虫的Urllib库

python爬虫urllib库使用

python爬虫urllib库详解

Python爬虫urllib库的使用

python爬虫的urllib库详解

Python爬虫之 urllib库

python 爬虫之 urllib库

初识python爬虫urllib库

爬虫01-urllib常用函数

URLLIB库之函数介绍-爬虫

爬虫中urllib库和函数

python爬虫（一）：urllib（不常用）

爬虫(2)urllib和parse库的介绍和常用函数介绍和使用

python爬虫学习——urllib、urllib2库的使用

python爬虫库——requests常用函数

python 爬虫基础之urllib 库详解

Python爬虫入门：Urllib库的高级使用

Python爬虫入门：Urllib库的基本使用

python爬虫入门urllib库的使用

python爬虫 urllib库基本使用

Python 爬虫 Urllib2库的变更

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)