1. urllib库
2. requests库 安装 pip install requests
3. selenium库 安装 pip install selenium 主要用于获取js渲染之后的内容
4. 安装 chromedriver
1.搜索chromedriver 下载安装包
2.下载
3.下载好的压缩包解压到配置了环境变量的python同级目录下
5.命令行测试,是否安装成功
实例化driver对象后,会出现浏览器弹窗,然后get()方法,可以打开网站。
5. 安装 phantomjs (无界面浏览器,相对于chromedriver ,是不会出现浏览器窗口)
下载phantomjs并解压,将bin目录下的phantomjs.exe文件放在python同级目录下,运行。
在使用时,selenium已经放弃phantomJs的支持,可以进行版本的降级,或者使用headless