첫째날 :주의 사항


A. 파충류 기본 원리
1. 파충류는 무엇입니까?
파충류는 데이터를 크롤링

2. 인터넷이 무엇입니까?
인터넷에 대만과 대만의 컴퓨터에 네트워크 장비의 무리에 의해 함께 인터넷 전화

인터넷의 설립의 목적 3.?
데이터의 데이터 전송 및 공유

데이터 무엇입니까 (4)?
예를 들어 : 제품 정보 전기 공급 플랫폼 (Taobao의는 Jingdong, 아마존), 가정의 체인,
편안 임대 플랫폼 (명부), 지분 증권 투자 정보 (동부 부, 눈덩이 네트워크), 12306 (티켓 정보),

5. 무엇입니까 인터넷?
일반 사용자 :
브라우저를 열고 ----> URL을 입력
----> 호스트가 대상에 요청을 보냅니다
----> 응답 데이터를 반환
---->에서 브라우저에 렌더링 데이터

크롤러 :
아날로그 브라우저 - ---> 호스트는 대상에 요청을 보냅니다
-----> 응답 데이터를 반환
-----> 구문 분석을하고 가치있는 데이터를 추출
저장된 데이터 (파일은 로컬, 지속적인 데이터베이스에 기록) ----->

(6) 전체 프로세스 파충류
①가 요청 (요청 라이브러리 : 요청 / 셀레늄) 전송
응답 데이터 가져 오기 ②
③ 분석 데이터를 (구문 분석 라이브러리 학습 : BeautifulSoup4)
데이터를 저장 ④를 (저장소 : 파일 / MongoDB를 저장)

요약 : 우리는 인터넷에 넣을 수 있습니다 데이터가 보물에 비유, 파충류 실제로 보물을 파고

두 .requests 요청 라이브러리
1. 설치 및 사용
PIP3는 요청을 설치

2. 아날로그 브라우저 (요구 분석 프로세스)
: 바이
① URL 요청
② 요청 메소드 (는 GET, POST가)
③ 응답 상태 코드를

추천

출처www.cnblogs.com/Auraro997/p/11119971.html