Python爬虫进阶之selenium定位不到元素的几种情况和解决方法

1>动态ID,每次调用页面出现的元素的ID会动态随机分配。
解决方案:推荐使用xpath的相对路径方法查找到该元素。

2>内嵌页面Iframe,导致无法定位到Iframe的页面元素。
解决方案:driver.switchTo().frame(Id/name/element)来进行进入指定id/name/element的iframe内嵌页面中,从而可以定位iframe内部元素。
具体来说:
如果iframe有name或id的话,直接使用switch_to_frame("name值")或switch_to_frame("id值")。如下:
driver=webdriver.Firefox()
driver.get(r'http://www.126.com/')
driver.switch_to_frame('x-URS-iframe')  #需先跳转到iframe框架
username=driver.find_element_by_name('email')
username.clear()
 
如果iframe没有name或id的话,则可以通过下面的方式定位:
#先定位到iframe
elementi= driver.find_element_by_class_name('APP-editor-iframe')
#再将定位对象传给switch_to_frame()方法
driver.switch_to_frame(elementi) 
 
如果完成操作后,可以通过switch_to.parent_content()方法跳出当前iframe,或者还可以通过switch_to.default_content()方法跳回最外层的页面。

3>Xpath定位不到。
解决方案:可以使用css selector进行定位,或者使用driver.findElements()来获取一组元素,再进行遍历出想要的那个元素。

4>点击速度过快,导致页面还未加载完成,定位不打对应元素
解决方案:使用Thread.sleep()来增加一定的等待时间。

5>firefox安全性强,不允许跨域调用出现报错。
解决方案:这是因为firefox安全性强,不允许跨域调用。
Firefox 要取消XMLHttpRequest的跨域限制的话,第一
是从 about:config 里设置:signed.applets.codebase_principal_support = true; (地址栏输入about:config 即可进行firefox设置)
第二就是在open的代码函数前加入类似如下的代码:
try:
    netscape.security.PrivilegeManager.enablePrivilege("UniversalBrowserRead")
catch (e) :
    alert("Permission UniversalBrowserRead denied.")


6>窗口切换,窗口句柄还处在上一个窗口,导致无法定位新窗口的元素。换句话说, 有些按钮在html上没有被赋予herf链接,而是由javascript控制跳转到新的页面,这种情况下点击按钮之后浏览器上打开一个新页面,但是浏览器的句柄handle仍然会停留在原页面(浏览器显示的句柄在新页面,所以不容易发现这个问题),而不是新弹出的页面上,所以要定位新页面的元素,必须先将句柄转移到新弹出的页面上,再去进行定位,用到如下语句:

#获得浏览器上所有窗口

handles = driver.window_handles

解决方案:
handles = driver.window_handles
for windowId  in  handles:
                        if(!windowId.equals(currentWindow))
                                 driver.switchTo().window(windowId)
                                 print(driver.getCurrentUrl())
        break



猜你喜欢

转载自blog.csdn.net/m0_37338590/article/details/80749231