C 1. 背诵 - 常用指令(18年7月)

1 scrapy框架


1.1 文件保存

  1. 利用 -o将抓取的数据保存为 books.csv
# 运行并保存
scrapy crawl book_spider -o books.csv

1.2 页面解析

  1. self的含义:
    在Python类中规定,函数的第一个参数是实例对象本身,并且约定俗成,把其名字写为self,参考:
    https://blog.csdn.net/love666666shen/article/details/78189984
  2. css、xpath命令
    https://blog.csdn.net/mouday/article/details/80455560

1.3 单词

  1. extract() 提取
  2. yield 生成器

猜你喜欢

转载自blog.csdn.net/qq_41682050/article/details/81043225
今日推荐