Python爬取hupu这妹子真漂亮图片遇到的坑 - 代码天地

Python爬取hupu这妹子真漂亮图片遇到的坑

其他 2018-12-20 12:41:02 阅读次数: 0

1，urllib.error.HTTPError: HTTP Error 404: Not Found
解决方案：反爬虫机制会检测是不是真实浏览器的访问请求，一般的情况下加入user agent可以。但是虎扑比较另类，需要加入上一次成功访问时返回的cookie才可以

知识补充：
Python [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed 解决方法

问题的原因是“SSL: CERTIFICATE_VERIFY_FAILED”。
Python 升级到 2.7.9 之后引入了一个新特性，当使用urllib.urlopen打开一个 https 链接时，会验证一次 SSL 证书。
而当目标网站使用的是自签名的证书时就会抛出一个 urllib2.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:581)> 的错误消息，

解决方案包括下列两种方式：

使用ssl创建未经验证的上下文，在urlopen中传入上下文参数

import ssl
import urllib2

context = ssl._create_unverified_context()
print urllib2.urlopen(“https://www.12306.cn/mormhweb/”, context=context).read()
2. 全局取消证书验证

import ssl
import urllib2

ssl._create_default_https_context = ssl._create_unverified_context

print urllib2.urlopen(“https://www.12306.cn/mormhweb/”).read()
注意：在全全局请求文件导入import ssl

import ssl
ssl._create_default_https_context = ssl._create_unverified_context
至此，问题圆满解决！

2，python3 UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 1: invalid start byte
解决方案：浏览器请求的时候加入了accept encoding字段，造成服务器返回的内容是经过加密的，所以直接read().encode(‘utf-8’)会出现上述错误

扫描二维码关注公众号，回复： 4577648 查看本文章

猜你喜欢

转载自blog.csdn.net/jigetage/article/details/78940239

Python爬取hupu这妹子真漂亮图片遇到的坑

python爬取淘宝漂亮的妹子图片

Python爬取妹子图片

python-python爬取妹子图片

Python爬虫之——爬取妹子图片

爬取妹子图片

妹子图图片爬取

妹子图片的全爬取

python爬取煎蛋网妹子图，已解密图片~~~~~

Python爬取全站妹子图片，差点硬盘走火了！

Python爬取全站妹子图片, 差点硬盘走火了!

Python3多线程爬取妹子图的图片

Python3爬取美女妹子图片转载

python爬虫学习（十三）xpath爬取妹子图片

python爬虫学习（七）爬取单张妹子图片

python爬取妹子图

爬取妹子图网站的图片

爬虫小案例爬取（妹子图片）

爬取妹子图片（简单入门）

Python3 Scrapy框架学习三：爬取煎蛋网加密妹子图片(全爬)

[python爬虫]爬取妹子图

Python爬虫教程：爬取妹子图

python 爬取煎蛋ooxx妹子图

Python爬取煎蛋妹子图

Python 爬取煎蛋妹子图

python爬虫——爬取妹子图

福利！！！Python爬取好看的妹子图！！！

【福利篇】python爬取妹子图

Python福利——爬取妹子图

python项目-爬取妹子图

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)