> 참조 : https://www.cnblogs.com/hy123456/p/9847570.html
에서 pycharm
생성되지 않는 scrapy
프로젝트의 옵션을 수동으로 작성해야합니다.
다음 두 가지 방법으로 만들 수있다 scrapy
패션 아이템 먼저 수동으로 만드는 것입니다, scrapy
프로젝트를 다음으로 가져 pycharm
, 두 번째는에 바로 pycharm
프로젝트를 생성 할 수있는 명령 줄 창을 사용 (내가 사용하는 것은이 더 편리합니다) ;
1. 수동 가져 오기 모드 만들기
-
현재 프로젝트에 대한 가상 공간을 만들기 :
VIRTUALENV --no-사이트 패키지 ScrapyLearning
-
현재 가상 공간을 시작합니다 :
# 창에서 관련 가상 공간에서 현재 디렉토리로 : ScrapyLearning / 스크립트 / 액티브 한의 #은 현재 가상 공간 활성화
-
설치
scrapy
:-i https://pypi.douban.com/simple/ scrapy PIP의 설치 # 사용 물냉 소스를
-
사용
scrapy
만드는scrapy
프로젝트 :( 직접하지 않도록주의script
프로젝트의 새 디렉토리를)startproject ArticleSpider scrapy # 프로젝트 이름 ArticleSpider
-
ArticleSpider
프로젝트 가져 오기pycharm
.
2. pycharm
생성
-
pycharm
새로운 건설에서 현재 프로젝트에 대한 가상 공간을 만들도록 선택; -
에서
pycharm
하단Terminal
설치하려면 다음 명령을 입력합니다scrapy
(없는 경우) :-i https://pypi.douban.com/simple/ scrapy PIP의 설치 # 사용 물냉 소스를
-
에서
pycharm
의 하단부Terminal
입력 :scrapy startproject ArticlePaqu
현재 프로젝트 디렉토리 아래에 생성됩니다
ArticlePaqu
폴더, 이것은이다scrapy
프로젝트 폴더.
3. 작은 파충류 만들기
하나의 작은 파충류 만들기, 크롤링 scrapy
공식적으로 샘플 페이지를 지정 : example.com
.
명령 줄이나 pycharm
에 Termina
창 유형 (그것은 새로운 프로젝트 디렉토리의 다음 앞해야한다) :
scrapy genspider 예 ' www.example.com '
에있을 것입니다 spider
크롤러 폴더 생성 python
파일을 자동으로 초기 코드를 작성 :
# - * - 코딩 : UTF-8 - * - 임포트 scrapy의 클래스 ExampleSpider (scrapy.Spider) 이름 = ' 예 ' allowed_domains = ' example.com ' ] start_urls = ' http://example.com/ ' ] DEF 파싱 (자동 응답) 패스
4. 실행 파충류
4-1 명령 줄 또는 유형 :pycharm
Terminal
scrapy 크롤링 예
시작하려면 example
크롤러.
4-2 직접 실행하여 실행 파일 :pycharm
python
필요 scrapy
프로젝트의 루트 디렉토리 생성 main.py
파일 :
에서 scrapy.cmdline를 가져 실행 오기 SYS 오기 OS의 #을 클리핑 모듈 얻는 ((에 os.path.dirname (os.path.abspath sys.path.append를 __FILE__ ))) 실행 ([ ' Scrapy ' , ' 크롤링 ' , ' 예 ' ])
즉 동일합니다
scrapy 크롤링 예
명령은 세 부분으로 나누어 져 list
배치 된 python
실행 프로그램 execute
의 기능.
그런 다음를 잘 할 수 기능 실행 크롤러.run
main.py
example