以chrome浏览器为例。
先要找到cookies:登录要爬取的网站,然后在chrome浏览器中 设置-高级-内容设置-cookie,ctrl+f搜索网址,找到对应的cookie。也可以通过登录前后cookie比对,找到新增的cookie添加。
#cookie格式 cookie={ 'domain':'.baidu.com'#注意前面有个点 'name':'' 'value':'' 'path':'' #这些都可以在cookie里找到 } #这样就是一条cookie启动:
from selenium import webdriver driver = webdriver.PhantomJS(executable_path=path)
driver.get(url)
添加cookie之前需要先driver.get(url),并且注意domain写法否则可能会导致报错: Can only set Cookies for the current domain
然后建议先删除原有cookie再添加,尤其是在交互环境下使用时:
driver.delete_all_cookies()
添加cookie:
driver.add_cookie(cookie)
可以通过
driver.get(url) driver.page_source查看页面内容判断是否登录成功