爬虫01-urllib常用函数 - 代码天地

爬虫01-urllib常用函数

其他 2020-03-11 10:17:33 阅读次数: 0

from urllib import request
from urllib import parse
#1.读取网页
url="http://www.baidu.com"
resp=request.urlopen(url)
# print(resp.getcode())#获取响应码
# print(resp.read())#读取网页
# print(resp.readline())#读取一行
# print(resp.readlines()[1])#读取网页返回列表

#2.下载
request.urlretrieve("http://www.baidu.com","baidu.html")#下载网页
request.urlretrieve("https://bkimg.cdn.bcebos.com/pic/38dbb6fd5266d0167927ca029b2bd40735fa35d9?x-bce-process=image/resize,m_lfit,w_268,limit_1/format,f_jpg","Jay.jpg")

#3.编码解码
params={"wd":"周杰伦"}
qs=parse.urlencode(params)#编码
sq=parse.parse_qs(qs)#解码
print(sq)

#4.获取请求头信息
result=parse.urlparse(url)
print(result)#全部信息
print(result.scheme)
print(result.netloc)
print(result.path)
print(result.params)
print(result.query)
print(result.fragment)

result2=parse.urlsplit(url)
print(result2)#全部信息
print(result2.scheme)
print(result2.netloc)
print(result2.path)
#print(result2.params) 没有这一项剩下和parse一样
print(result2.query)
print(result2.fragment)

　　

猜你喜欢

转载自www.cnblogs.com/wcyMiracle/p/12460626.html

爬虫01-urllib常用函数

01-urllib库常用函数

爬虫01之urllib

爬虫（2）——urllib库里面的常用的函数

Win10系统下Python爬虫常用库的安装01——urllib、re、requests

【爬虫】01 urllib 爬取网页

爬虫(2)urllib和parse库的介绍和常用函数介绍和使用

python爬虫（一）：urllib（不常用）

python爬虫常用库之urllib详解

URLLIB库之函数介绍-爬虫

爬虫中urllib库和函数

2.03_01_Python网络爬虫urllib2库

python爬虫01-使用urllib爬取网页

爬虫urllib

爬虫_urllib

python爬虫系列(1.1-urllib中常用方法的介绍)

爬虫--Python常用模块之requests,urllib和re

Python3 urllib.parse 常用函数示例

Python3的urllib.parse常用函数小结

爬虫基础——urllib模块

爬虫二（urllib模块）

爬虫2：urllib

python爬虫——urllib库

Python爬虫——urllib的使用

爬虫（五）urllib

PYTHON爬虫（urllib详解）

urllib之爬虫

爬虫--urllib模块

python爬虫，Urllib库

urllib 网页爬虫

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

tensorflow 笔记：二（北大）

fork函数详解

unity单利模板

mac下的特殊键位指引（转自apple）

c语言入门-注释

Python--多任务[线程，进程，协程]

深度对抗学习在图像分割和超分辨率中的应用

【转】【Maven】Project configuration is not up-to-date with pom.xml错误解决方法

基本数据类型与常量池

部署自己的Intell项目的经历

每日归档

更多

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)