python爬虫十三:selenium模拟浏览器+chrome+windows

最近一直在学习爬虫,教程都是phantomjs的浏览器,听说性能好,速度快,呵呵,但是phantomjs这个玩意前不久和selenium模块分手了,他们都震惊了,我也跟着震惊一下。。。


不扯淡了,下面是介绍在selenium下的chrome浏览器的配置

1.现在大神那里下载chrome的驱动点击打开链接



2.下载好后,将驱动复制到python目录下


3.下载就要下载一个版本对应的浏览器


5.ok在网上下载对应的google浏览器点击打开链接,这个网站很棒!!!


6.下载只要在我们的pycharm中运行代码就ok了

# -*- coding: utf-8 -*-

from selenium import webdriver

from time import sleep

#掉用第三方包selenium打开浏览器登陆
driver=webdriver.Chrome()#打开chrome
#driver.implicitly_wait(30)
#driver.maximize_window() #窗口最大化(无关紧要哈)


# 用get打开百度页面
driver.get("http://www.baidu.com")
# 查找页面的“设置”选项,并进行点击
driver.find_elements_by_link_text('设置')[0].click()



# 打开设置后找到“搜索设置”选项,设置为每页显示50条
'''
<a class="setpref" href="javascript:;">搜索设置</a>'''
driver.find_elements_by_link_text('搜索设置')[0].click()
sleep(2)


'''
<select name="NR" id="nr">
<option value="10" selected="">每页显示10条</option>
<option value="20">每页显示20条</option>
<option value="50">每页显示50条</option>
</select>
'''
m = driver.find_element_by_id('nr')
sleep(2)
m.find_element_by_xpath('//*[@id="nr"]/option[3]').click()
sleep(2)



# 处理弹出的警告页面
#点击确定警告框
driver.find_element_by_class_name("prefpanelgo").click()
sleep(2)
driver.switch_to_alert().accept()
sleep(2)


# 找到百度的输入框,并输入“selenium”
'''
<input id="kw" name="wd" class="s_ipt" value="" maxlength="255" autocomplete="off">'''
driver.find_element_by_id('kw').send_keys('selenium')
sleep(2)


# 点击搜索按钮
'''
<input type="submit" id="su" value="百度一下" class="bg s_btn">
'''
driver.find_element_by_id('su').click()
sleep(2)
# 在打开的页面中找到“Selenium - 开源中国社区”,并打开这个页面
driver.find_elements_by_link_text('Selenium_百度百科')[0].click()
流畅的一笔!!

猜你喜欢

转载自blog.csdn.net/qq_38788128/article/details/80525695
今日推荐