使用 anacoda 安装scrapy

1)安装scrapy

在Anacoda Prompt 中输入:  

 condainstall scrapy 

输入y回车表示允许安装依赖库:y

测试scrapy 是否安装成功:

完成后,再输入命令查看scrapy 依赖的包:

conda install service_identity

在pycharm 中选中anaconda


2)编写第一个 spider

文件名: firstspider.py

import scrapy
class Firstspider(scrapy.Spider):
    name = "quotes"
    start_urls = [
        'http://quotes.toscrape.com/tag/humor/',
    ]
    def parse(self, response):
        for quote in response.css('div.quote'):
            yield {
                'text': quote.css('span.text::text').extract_first(),
                'author': quote.xpath('span/small/text()').extract_first(),
            }
        next_page = response.css('li.next a::attr("href")').extract_first()
        if next_page is not None:
            yield response.follow(next_page, self.parse)

在anaconda promt 中执行下面的命令,会看到生成一个json 文件:

scrapy runspider firstspider.py -oquotes.json


猜你喜欢

转载自blog.csdn.net/henku449141932/article/details/81009587