JS中url的decodeUROI对应python中的urllib库中的unquote方法 - 代码天地

JS中url的decodeUROI对应python中的urllib库中的unquote方法

其他 2018-09-11 16:18:51 阅读次数: 0

我们在使用python进行url获取的过程中，也存在通过pythonurl地址进行数据获取的过程，这时候如果我们使用中文作为关键词，由于存在对于中文和空格等字符的加密规则，所以我们需要对他们进行解密操作，

在JS中存在decodeURI可以针对url中的中文进行操作，在python中我们可以使用urllib中的unquote方法进行操作。

实例：

通过下面一段代码进行数据获取时，结果如图：

for item in movies:
        url = item[0]
        title = item[1]
        r = requests.get(url)
        r.encoding = r.apparent_encoding
        soup = BeautifulSoup(r.text, 'lxml')
        director = soup.findAll('p')[0].a.get_text()
        detail = soup.findAll('p')[0].a['href']

        save_to_json(director, detail, title, url)
        print director, title, detail

使用解密后的url进行输出，可以得到结果如下图：

for item in movies:
        url = item[0]
        title = item[1]
        r = requests.get(url)
        r.encoding = r.apparent_encoding
        soup = BeautifulSoup(r.text, 'lxml')
        director = soup.findAll('p')[0].a.get_text()
        detail = soup.findAll('p')[0].a['href']

        save_to_json(director, detail, title, url)
        # 使用urllib.unquote()进行url中包含文字的解密
        print director, title, urllib.unquote(detail)

猜你喜欢

转载自blog.csdn.net/qq_32670879/article/details/82185258

JS中url的decodeUROI对应python中的urllib库中的unquote方法

Python 3.x 中如何使用urllib.parse.unquote()函数对URL进行解码

urllib中的网页的编码（urlencode）、解码(unquote)

Python2中urllib、urllib2在Python3中urllib库导入对应关系

python中的urllib库的学习

Python中urllib库详解

爬虫中urllib库

python学习笔记——urllib库中的parse

Python3中urllib库的使用

js中获取url中参数的方法

Python中的urllib

url中urllib.parse小技巧

利有Python库urllib.parse的成员函数parse_qs()解析URL 中的查询字符串

urllib库中cookie的使用

爬虫中的urllib库使用

[python] python中的urllib模块

通过URL访问php对应的类中的方法

数据爬虫（二）：python爬虫中urllib库详解,parse和request使用方法

urllib模块中的urlretrieve方法

js中获取URL参数的方法

使用JS获取URL中参数的方法

js获取url中的中文参数的方法

js获取URL中的参数方法

使用js从URL中获取参数的方法

Python pygamek库中的按键对应

Python中的urllib2

Python中urllib模块的使用

python urllib中的urlparse模块

python学习笔记——爬虫学习中的重要库urllib

Python2/3中的urllib库相关用法

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)