Python自动采集淘宝信息,了解下

 

IDE:根据个人喜好

导入我们的第三方测试模块和时间模块

1 from selenium import webdriver
2 
3 import time

 

实战步骤流程

  1. 创造一个浏览器对象
  2. 输入要访问的网址
  3. 找到搜索框的唯一标示,并且给他一个变量保存可操作对象
  4. 输入我们要找的关键字.
  5. 找到对应ID的操作按钮标识,并且用变量保存按钮对象
  6. 点击按钮对象
  7. 创建一个文件
  8. 生成要翻页的页数.
  9. 控制浏览器的滚动条,让他加载数据
  10. 浏览器滚动结束以后,开始取出数据
  11. 遍历我们取出来的数据,取出每一个商品的信息
  12. 用xpath的语法去找到网页中的按钮标签
  13. 判断一下这个标签是否存在(异常处理)
  14. 实现翻页的功能

 

完整代码

 

猜你喜欢

转载自www.cnblogs.com/Python6359/p/9147286.html