持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第2天,点击查看活动详情
迟来的第二篇来了
前言
元素定位不到, 这是一个经常遇到的问题,在之前的文章中也介绍过大概有以下几种
- 元素定位写的不对
- 页面加载超时
- 没有在同一个页面(窗口)或iframe
- 页面存在多个相同的元素
等等,这些操作的时候,都会报相应的异常错误,这些异常详细可参考我这篇文章 selenium操作元素遇到的异常
debug
来详细说一下,这次遇到的问题,是怎么定位的
1 先检查元素定位是否正确
手工打开这个页面,并找到该链接元素 脚本中这个链接元素定位是用xpath,可以使用xpath插件来验证,也可以打开开发者工具来使用另一款插件来找到该元素的xpath定位和你写的是否一致
经过定位,这个xpath表达式是没有问题的
2 在脚本中增加延时/获取当前页面窗口handler,打印页面url,进行debug
在页面中增加延时可以使用以下几种方法
使用python time模块的sleep函数,例如增加2秒延时
time.sleep(2)
selenium 自带的函数,隐士等待
例如 30秒内没有加载完成,也会继续执行后续代码
driver.implicitly_wait(30)
复制代码
selenium 的 显示等待
等待时长20秒,间隔0.5秒去查询一次目标元素是否加载完成 20秒内加载完成后,执行后续的代码,最长等待20秒,没有加载也会继续执行
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver.get(url)
locator = (By.LINK_TEXT, 'xxxx')
# 20 秒是最长等待时间, 0.5 秒是间隔轮询时间
WebDriverWait(driver,20,0.5).until(EC.presence_of_element_located(locator))
复制代码
获取handler
在脚本里需要打印handler和URL 的地方,打印出来
获取当前窗口句柄和页面URL:
from selenium import webdriver
current_window = driver.current_window_handle
print(current_window)
current_url = driver.current_url
复制代码
获取所有窗口句柄:
# 获取当前所有打开的窗口句柄
all_windows = driver.window_handles
print(all_windows)
复制代码
结果
经过以上方式debug,发现会经过两个跳转,但handler都是同一个handler,但是不同的URL, 总是定位失败的那个元素在第二个页面URL 那里, 但是执行过程中,跳转到第二个页面之后,会再次自动跳转到第一个页面,所以导致该链接元素定位不到, 至于为啥会自动跳转到第一个页面,需要和相应的开发者沟通,为了快速运行脚本,这里暂用了一个折中的方法, 获取到第二个URL, 然后用代码driver.get( second_url)再次跳一次,去执行后续脚本