超级强大的破解极验滑动验证码--讲解非常详细

废话不多说，好久不写博客了，难得用心写了一下，怎么也给自己留个念想。。。虽然工作上暂时用不到。。。
其实网上已经好多了，我写的时候遇到的问题也参考了不少其他人的代码，嗯。。，那我这个就叫小白解读帖吧，讲解还算详细
网站说：
少于150字的随笔不允许发布到网站首页
尼玛，我下面的代码数量何止150个字啊，哎，开始凑字数，你们懂的，作为毫无营养的废话，我决定用颜色把他。。。靠，我说到哪了，嗯，反正也是废话，凑字而已。日啊
自己都看不见的文字，让我想起了m。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
我们开发的说，能写一行代码的绝对不写两行，但凡能携程这样的都是可以优化的，好比lamabada变大时，我觉得我打错了。好吧，好吧，反正我也看不见。。凑够字了吧。。
# -*- coding: utf-8 -*-
"""
@author：你们的龙哥
@2018-06-21
规则只匹配极验的官网，若使用破解验证码的规则，仍需要根据实际项目情况做调整
建议：本程序提供的是思路，无需修改本程序代码
写代码过程中遇到的问题：
1、chrome driver要下载，并配置好，过程忘记了，请百度。driver的版本一定要和chrome的版本对应。。。
2、chrome浏览器不在环境变量的，要把第32行（大概位置）注释解开，并填入自己电脑chrome的位置。要不就会报错，二进制文件找不到之类的。
3、reload（sys)要加，不然不能识别中文
4、location定位的时候，经常出白图，是因为save_screenshot()截屏的时候，保存的图片像素为实际像素的2倍，这个百度了一下，有人说是高分屏的原因,因为我用的mac？
5、第一次识别失败后，经常会报错，好像是时间超时之类的，我try掉了。想踩雷的，可以去掉所有的try自己玩一下。
6、本代码经过本机的极限测试，连续尝试40多次后依然可以正常运行，然后我就手动结束了测试。
"""

from PIL import Image
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.chrome.options import Options
import logging
import time
import sys
reload(sys)
sys.setdefaultencoding('utf8')

# 本段为指定chrome浏览器的位置，如果chrome安装的时候放到了环境变量中，应该用不到这样写,注释掉就可以
# 果然，把chrome移动到应用程序里面后，自动就配置到环境变量了（mac本）
chrome_options = Options()
# chrome_options.binary_location = r"/Users/qmp/Downloads/Google Chrome.app/Contents/MacOS/Google Chrome"


class CrackGeetest():
    """
    实现了正常登陆、错误重试、多次重试后刷新图片的功能。。。除非规则和页面结构变更，要不基本走不到多次刷新图片重试这一步
    没有对crack()和fail_again()这两个类方法进行精简，是希望程序的运行步骤清晰明了。。。
    """
    def __init__(self,url,email,password,threshold=60,left=57,deviation=6):
        self.url = url
        self.driver = webdriver.Chrome(chrome_options=chrome_options)
        self.wait = WebDriverWait(self.driver,10)
        self.email = email
        self.password = password
        self.threshold = threshold #验证码图片对比中RGB的差值，可调
        self.left = left #验证码图片的对比中的起始坐标，即拖动模块的右边线位置
        self.deviation = deviation # 偏移量，这个值是多次测试得出的经验值
        self.count = 1

    def close_win(self):
        self.driver.close()

    def get_geetest_button(self):
        """
        点击按钮，弹出没有缺口的图片
        :return: 返回按钮对象
        """
        button = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_radar_tip')))
        return button

    def get_slider(self):
        """
        获取滑块
        :return: 滑块对象
        """
        slider = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME,'geetest_slider_button')))
        return slider

    def get_snap(self):
        """
        对整个网页截图，保存图片，然后用PIL.Image拿到图片对象
        :return: 图片对象
        """
        self.driver.save_screenshot('极验验证过程中产生的图片.png')
        page_snap_obj = Image.open('极验验证过程中产生的图片.png')
        return page_snap_obj

    def get_image(self,name='captcha.png'):
        """
        从网页的网站截图中，截取验证码图片
        :return: 验证码图片对象
        """
        img = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_canvas_img')))
        time.sleep(2)  # 保证图片刷新出来
        location = img.location
        size = img.size
        top = location['y']
        bottom = location['y'] + size['height']
        left = location['x']
        right = location['x'] + size['width']
        page_snap_obj = self.get_snap()

        #这里强调一下：大概由于高分屏的原因，网页的截图是实际像素的2倍，所以验证码定位也要相应*2
        # crop_imag_obj = page_snap_obj.crop((left,top,right,bottom))
        crop_imag_obj = page_snap_obj.crop((2 * left, 2 * top, 2 * right, 2 * bottom))
        size = 258, 159
        crop_imag_obj.thumbnail(size)
        #实际生产环境下就不需要保存这张图片了
        # crop_imag_obj.save(name)
        return crop_imag_obj

    def open(self):
        """
        打开网页输入用户名和密码
        :return:
        """
        self.driver.get(self.url)
        email = self.wait.until(EC.presence_of_element_located((By.ID, 'email')))
        password = self.wait.until(EC.presence_of_element_located((By.ID, 'password')))
        email.send_keys(self.email)
        password.send_keys(self.password)

    def get_distance(self,image1, image2):
        """
        拿到滑动验证码需要移动的距离
        :param image1: 没有缺口的图片对象
        :param image2: 带缺口的图片对象
        :return: 需要移动的距离
        """
        i = 0
        for i in range(self.left, image1.size[0]):
            for j in range(image1.size[1]):
                rgb1 = image1.load()[i, j]
                rgb2 = image2.load()[i, j]
                res1 = abs(rgb1[0] - rgb2[0])
                res2 = abs(rgb1[1] - rgb2[1])
                res3 = abs(rgb1[2] - rgb2[2])
                if not (res1 < self.threshold and res2 < self.threshold and res3 < self.threshold):
                    return i - self.deviation  # 误差矫正
        logging.debug('未识别出验证码中的不同位置，或图片定位出现异常')
        return i  # 如果没有识别出不同位置，则象征性的滑动，以刷新下一张验证码

    def get_tracks(self,distance):
        """
        拿到移动轨迹，模仿人的滑动行为，先匀加速后均减速
        匀变速运动基本公式：
        ①：v=v0+at
        ②：s=v0t+½at²
        ③：v²-v0²=2as
        :param distance:需要移动的距离
        :return:存放每0.3秒移动的距离
        """
        distance += 20  # 先滑过一点，最后再反着滑动回来
        # 初速度
        v = 0
        # 单位时间为0.3s来统计轨迹，轨迹即0.3s内的位移
        t = 0.3
        # 位移/轨迹列表，列表内的一个元素代表0.3s的位移
        forward_tracks = []
        # 当前位移
        current = 0
        # 到达mid值开始减速
        mid = distance * 4 / 5
        while current < distance:
            if current < mid:
                # 加速度越小，单位时间的位移越小，模拟的轨迹就越多越详细
                a = 2
            else:
                a = -3
            # 初速度
            v0 = v
            # 0.3秒时间内的位移
            s = v0 * t + 0.5 * a * (t ** 2)
            # 当前的位置
            current += s
            # 添加到轨迹列表,round()为保留一位小数且该小数要进行四舍五入
            forward_tracks.append(round(s))
            # 速度已经达到v，该速度作为下次的初速度
            v = v0 + a * t

        # 反着滑动到准确位置
        back_tracks = [-3, -3, -2, -2, -2, -2, -2, -1, -1, -1]  # 总共等于-20
        return {'forward_tracks': forward_tracks, 'back_tracks': back_tracks}

    def login(self):
        """
        登录
        :return: None
        """
        submit = self.wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'login-btn')))
        submit.click()
        print('登录成功')
        logging.debug('登陆成功')

    def crack(self):
        """
        程序运行流程。。。
        :return:
        """
        #步骤一：输入同户名密码
        self.open()

        #步骤二：点击按钮，弹出没有缺口的图片
        button = self.get_geetest_button()
        button.click()
        time.sleep(0.5)

        # 步骤三：拿到没有缺口的图片
        image1 = self.get_image('captcha1.png')

        # 步骤四：点击托送按钮，弹出有缺口的图片
        slider = self.get_slider()
        slider.click()

        #步骤五：拿到有缺口的图片
        image2 = self.get_image('captcha2.png')

        #步骤六：对比两张图片的所有RBG像素点，得到不一样像素点间的差值，即要移动的距离
        distance = self.get_distance(image1, image2)

        # 步骤七：模拟人的行为习惯（先匀加速拖动后匀减速拖动），把需要拖动的总距离分成一段一段小的轨迹
        tracks = self.get_tracks(distance)

        # 步骤八：按照轨迹拖动，完成验证
        button = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_slider_button')))
        ActionChains(self.driver).click_and_hold(slider).perform()

        # 正常人类总是自信满满地开始正向滑动，自信地表现是疯狂加速
        for track in tracks['forward_tracks']:
            ActionChains(self.driver).move_by_offset(xoffset=track, yoffset=0).perform()

        # 结果傻逼了，正常的人类停顿了一下，回过神来发现，卧槽，滑过了,然后开始反向滑动
        time.sleep(0.6)
        for back_track in tracks['back_tracks']:
            ActionChains(self.driver).move_by_offset(xoffset=back_track, yoffset=0).perform()

        # 小范围震荡一下，进一步迷惑极验后台，这一步可以极大地提高成功率
        time.sleep(0.3)
        ActionChains(self.driver).move_by_offset(xoffset=3, yoffset=0).perform()  # 先移动去一点
        time.sleep(0.4)
        ActionChains(self.driver).move_by_offset(xoffset=-3, yoffset=0).perform()  # 再退回来，模仿人的行为习惯

        time.sleep(0.6)  # 0.6秒后释放鼠标
        ActionChains(self.driver).release().perform()

        try:
            success = self.wait.until(
                EC.text_to_be_present_in_element((By.CLASS_NAME, 'geetest_success_radar_tip'), '验证成功'))
            self.login()
            time.sleep(5)
            self.close_win()
        except:
            # 位置没定位好，或者时间太长了，所以本次失败，进入下一轮
            self.fail_again()


    def fail_again(self):
        """
        失败重试功能，加了好几个try，防止报错，使程序运行下去。在故意改变误差值（偏移量）的情况下，目前只尝试到40多次，遇到的报错都位于步骤三，程序暂无问题
        :return:
        """

        # 步骤二：点击刷新按钮，弹出没有缺口的图片，其实貌似也许大概，无需手动点刷新，失败后自动就刷新了，但我就这么写了。。。
        try:
            button = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_refresh_1')))
            button.click()
        except Exception as e:
            print e
            print '尝试次数过多，刷新一次图片-步骤二'
            button = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_reset_tip_content')))
            button.click()
            time.sleep(2)
            self.fail_again()

        # 步骤三：拿到没有缺口的图片
        try:
            time.sleep(0.5)
            image1 = self.get_image('captcha1.png')
        except Exception as e:
            print e
            print '尝试次数过多，刷新一次图片-步骤三'
            button = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_reset_tip_content')))
            button.click()
            time.sleep(2)
            self.fail_again()

        # 步骤四：点击托送按钮，弹出有缺口的图片
        try:
            slider = self.get_slider()
            slider.click()
        except Exception as e:
            print e
            print '尝试次数过多，刷新一次图片-步骤四'
            button = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_reset_tip_content')))
            button.click()
            time.sleep(2)
            self.fail_again()

        # 步骤五：拿到有缺口的图片
        try:
            image2 = self.get_image('captcha2.png')
        except Exception as e:
            print e
            print '尝试次数过多，刷新一次图片-步骤五'
            button = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_reset_tip_content')))
            button.click()
            time.sleep(2)
            self.fail_again()

        # 步骤六：对比两张图片的所有RBG像素点，得到不一样像素点间的差值，即要移动的距离
        distance = self.get_distance(image1, image2)

        # 步骤七：模拟人的行为习惯（先军加速拖动后匀减速拖动），把需要拖动的总距离分成一段一段小的轨迹
        tracks = self.get_tracks(distance)

        # 步骤八：按照轨迹拖动，完全验证
        button = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_slider_button')))
        ActionChains(self.driver).click_and_hold(slider).perform()

        # 正常人类总是自信满满地开始正向滑动，自信地表现是疯狂加速
        for track in tracks['forward_tracks']:
            ActionChains(self.driver).move_by_offset(xoffset=track, yoffset=0).perform()

        # 结果傻逼了，正常的人类停顿了一下，回过神来发现，卧槽，滑过了,然后开始反向滑动
        time.sleep(0.6)
        for back_track in tracks['back_tracks']:
            ActionChains(self.driver).move_by_offset(xoffset=back_track, yoffset=0).perform()

        # 小范围震荡一下，进一步迷惑极验后台，这一步可以极大地提高成功率
        time.sleep(0.3)
        ActionChains(self.driver).move_by_offset(xoffset=-4, yoffset=0).perform()  # 先移动去一点
        time.sleep(0.4)
        ActionChains(self.driver).move_by_offset(xoffset=4, yoffset=0).perform()  # 再退回来，模仿人的行为习惯

        time.sleep(0.6)  # 0.5秒后释放鼠标
        ActionChains(self.driver).release().perform()
        print self.count
        try:
            success = self.wait.until(
            EC.text_to_be_present_in_element((By.CLASS_NAME, 'geetest_success_radar_tip'), '验证成功'))
            self.login()
            time.sleep(5)
            self.close_win()
        except:
            self.count+=1
            if self.count<100:
                self.fail_again()
            else:
                self.close_win()


if __name__ == '__main__':
    url = 'https://account.geetest.com/login'
    email = '马赛克了吗'
    password = '赛克了'
    threshold = 60 #RGB色差
    left = 57 #起始位置
    deviation = 7 #偏移量，误差
    crack = CrackGeetest(url, email, password, threshold, left, deviation)
    crack.crack()
我去，赶紧马赛克账号密码，差点把自己暴露了
超级强大的破解极验滑动验证码--讲解非常详细

猜你喜欢