盘点一个Python网络爬虫过验证码的问题(方法三)

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

大弦嘈嘈如急雨,小弦切切如私语。

大家好,我是皮皮。

一、前言

前几天在Python最强王者群【鶏啊鶏。】问了一个Python网络爬虫的问题,这里拿出来给大家分享下。

上两个篇文章已经给了两个解决方法,第一个方法是直接请求图片的url,然后进行识别,效率也非常高;第二个方法是,直接定位到图片这个,然后完成截图,再进行识别。在这一篇文章,我们一起来看看第三个解决方法。

二、实现过程

这个方法是【魏哥】提供的,使用了第三方代码平台,名为【超级鹰】,相信很多小伙伴们也听说过,这里给大家分享下。

扫描二维码关注公众号,回复: 15763484 查看本文章

思路其实和第二种方法差不多,也是先定位到验证码图片,之后使用打码平台进行识别,之后返回验证码,然后输入账号、密码即可完成登录的操作,代码如下:

from selenium import webdriver
from selenium.webdriver.common.by import By
import time
from PIL import Image
import ddddocr
from chaojiying import Chaojiying_Client

ocr = ddddocr.DdddOcr()

options = webdriver.ChromeOptions()
options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36')
options.add_argument("--disable-blink-features=AutomationControlled")
driver = webdriver.Chrome(options=options)

# 打开目标网页
driver.get('https://sol.sinosure.com.cn')
time.sleep(3)

# 处理验证码
img = driver.find_element(By.XPATH, '//*[@id="codeimage"]').screenshot_as_png
chaojiying = Chaojiying_Client('666', '666', '923043')
print(chaojiying.PostPic(img, 1902))  # 得到的是一个字典的返回结果
dic = chaojiying.PostPic(img, 1902)
verify_code = dic["pic_str"]
print(verify_code)
10b111945eb784c30ce922743b72c11d.png

代码运行之后,也是可以顺利得到验证码的。针对该验证码的问题,目前已经给出了三个方法,如果你还有其他解决方法,欢迎分享!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python网络爬虫过验证码的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【鶏啊鶏】提问,感谢【甯同学】、【魏哥】、【瑜亮老师】、【郑煜哲·Xiaopang】、【东哥】给出的思路和代码解析,感谢【Ineverleft】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

f04f20f90b41de782c4e51e5ed8ef16a.png

大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting1),应粉丝要求,我创建了一些高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!

bd25255f06495ceba7d5a95c4b34f298.png

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

dada6f2e87a8235118de394f93b04bd1.jpeg

------------------- End -------------------

往期精彩文章推荐:

a5642e53573e42154b4abc47eb4e0702.png

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

猜你喜欢

转载自blog.csdn.net/pdcfighting/article/details/131388411