python自动化selenium实现登录获取图片_识别验证码功能

实战代码：识别图片验证码

1.获取登录界面的图片

2.获取验证码位置

3.在登录页面截取验证码保存

4.调用百度api识别（目前准确率较高的识别图片api）

from selenium import webdriver
import time
from PIL import Image
base_url = 'https://supplier.cmbchina.com/login.do'
browser = webdriver.Chrome()
browser.maximize_window()
browser.implicitly_wait(10)
browser.get(base_url)
# (1)登录页面截图
#browser.save_screenshot("img/pic.png")#可以修改保存地址
# (2)基操
browser.find_element_by_name("loginId").send_keys("gxx")
browser.find_element_by_name("password").send_keys("123456")
time.sleep(2)
# (3)获取图片验证码坐标
code_ele = browser.find_element_by_xpath("//img[@id='imgObj']")
print("验证码的坐标为：", code_ele.location)#控制台查看{'x': 1086, 'y': 368}
print("验证码的大小为：", code_ele.size)# 图片大小{'height': 40, 'width': 110}
# # (4)图片4个点的坐标位置
width='110'
height='43'
left = code_ele.location['x']#x点的坐标
top = code_ele.location['y']#y点的坐标
right = code_ele.size['width']+left#上面右边点的坐标
down = code_ele.size['height']+top#下面右边点的坐标
image = Image.open('img/pic.png')
# # (4)将图片验证码截取
code_image = image.crop((left, top, right, down))
code_image.save('img/pic1.png')#截取的验证码图片保存为新的文件

上面我们已经把图片保存到本地

这就是我们截取的验证码

在这里插入图片描述

接下来要调用百度ocr识别

链接: https://ai.baidu.com/docs#/

然后可以选择通用文字识别或者高精度版本，这个看个人选择，不过验证码识别还是选择高精度版本（也不一定识别的出来大家还是佛吧，测试的时候让开发把验证码去掉嘻嘻）
自己去申请一个百度云账号，然后开通文字识别服务…就酱
新建一个py文件

#百度ocr提供了模板，我们直接复制就ok
#下载通用文字识别的python sdk,一定要放在你写的代码的文件夹下面
from aip import AipOcr 
from os import path
def baiduOCR(picfile,outfile):#picfile:图片文件名 outfile:输出文件
  filename = path.basename(picfile)#图片名称
  #百度提供
  """ 你的 APPID AK SK """
  APP_ID = ''#这是你产品服务的appid
  API_KEY = ''#这是你产品服务的appkey
  SECRET_KEY = ''#这是你产品服务的secretkey
  client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
  i = open(picfile, 'rb')
  img = i.read()

  print("正在识别图片：\t" + filename)
  """ 调用通用文字识别（高精度版） """
  message = client.basicAccurate(img)
  print("识别成功！")
  i.close()
  with open(outfile, 'a+') as fo:#这边是写进.txt文件
    fo.writelines("*" * 60 + '\n')#搞点花里胡哨的做区分
    fo.writelines("识别图片：\t" + filename + "\n" * 2)
    fo.writelines("文本内容：\n")
    # 输出文本内容
    for text in message.get('words_result'):#识别的内容 
      fo.writelines(text.get('words') + '\n')
    fo.writelines('\n' * 2)
  print("文本导出成功！")
  print()

if __name__ == '__main__' :
  outfile = 'D:/export1.txt'#保存的文件
  baiduOCR('D:/pic1.png', outfile)
  print('图片文本提取结束！文本输出结果位于 %s 文件中。' % outfile)

在这里插入图片描述

这样就识别出来了，是不是不难~
好！这样验证码就识别出来了，然后把识别的内容输进框子里，点击登录就ok

联系我们，一起学Python吧

每周每日，分享Python实战代码，入门资料，进阶资料，基础语法，爬虫，数据分析，web网站，机器学习，深度学习等等。

微信群（关注「Python家庭」一起轻松学Python吧）

python自动化selenium实现登录获取图片_识别验证码功能

联系我们，一起学Python吧

猜你喜欢