수입 구문 분석 모듈을 URLLIB 사용에서

I. 서론

URL이 추출 URL의 다양한 달성하기 위해 표준 인터페이스를 정의

구문 분석 모듈 동작 : URL을 합하고, 부호화 복호화 파싱

둘째, 코드

방법 1 : urlparse

식별 및 실현 URL의 분할

에서 URLLIB 가져 오기 구문 분석 

URL = ' https://www.cnblogs.com/angelyan/ ' 
"" " 
URL : URL의 해결 
방식을 = '': URL이 프로토콜을 구문 분석하지 않는 경우가있는 경우, 기본 프로토콜이 제공 될 수있다 URL 프로토콜 설정이 매개 변수가 잘못 
앵커를 무시할지 여부, 그들은 기본이 생략, 허위 사실이다 무시하지 않았다 : allow_fragments = TRUE 
"" " 
결과 = parse.urlparse (URL = URL, 계획을 = ' HTTP ' , allow_fragments은 = 참) 

인쇄 (결과)
 인쇄 (result.scheme)
 "" " 
(= 계획 'HTTPS', netloc = 'www.cnblogs.com을'경로 = '/ angelyan /'엔 params = '', 쿼리 = '', 조각 = ' ') 
방식 : 프로토콜을 나타냅니다 
netloc를 :도메인 이름 
경로 : 경로 
PARAMS : 매개 변수
쿼리 : 쿼리, URL은 일반적으로 요청받을 
조각 : 직접 등록 페이지에 대한 앵커 
표면의 풀다운 위치를 페이지에 지정된 위치로 이동 
"" "

방법 2 : urlunparse

URL 구조가 달성 될 수있다

= url_parmas ( ' HTTPS ' , ' www.cnblogs.com ' , ' /은 / angelyan ' , '' , ' 이름 = 메이플 ' , ' 로그 ' )
 #의 구성 요소 :. 반복자 객체는 길이 6 있어야합니다 
결과 = 구문 분석 .urlunparse (url_parmas)
 인쇄 (결과) 

"" " 
https://www.cnblogs.com/angelyan/?name=maple#log 
" ""

방법 세 : urljoin

연결 기반 전송, 기지국은 어느 한 링크 불완전한 접합에 접속 될 수있다 전체 링크 인

BASE_URL = ' https://www.cnblogs.com ' 
sub_url = ' / angelyan / 이름 = 메이플 # 로그? ' 

full_url = parse.urljoin (BASE_URL, sub_url) 

인쇄 (full_url)
 "" " 
HTTPS : //www.cnblogs .COM / angelyan /? 이름 = 메이플 # 로그 
"" "

방법 사 :를 urlencode

GET 및 사후 요청을 구성하는 데 사용되는 URL 문자열 요청 매개 변수를 코딩 사전에 매개 변수의 순서 후

parmas = {
     ' 이름 ' : ' 메이플 ' ,
     ' 나이 ' : 18이다 
} 
parmas_str = parse.urlencode (parmas)
 인쇄 (parmas_str)
 "" " 
이름 = 메이플 & 나이 = 18입니다 
" "" 
parmas_str = ' = 18 이름 = 메이플 & 나이 ' 
# URL 파라미터 인코딩 형식 직렬화 사전 
parmas = parse.parse_qs (parmas_str)
 전단 (parmas) 

"" " 
{ '이름': '메이플', '연령'['18 인 ']} 
" " "

방법 오 : 인용

당신은 URL에 대한 중국어 인코딩 형식을 변환 할 수 있습니다

= 말씀 ' 중국의 꿈 ' 
URL = ' http://www.baidu.com/s?wd= ' + parse.quote (워드)
 인쇄 (parse.quote (워드))
 인쇄 (URL) 

"" " 
%의 E4의 % 는 AD E5 %%% B8 9B는 BD %의 A2 %%% E6 A6 
http://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD%E6%A2%A6 
"" " 
#의 인용을 끝내 : 디코딩 할 수있는 인코딩 된 URL 
URL을 = ' http://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD%E6%A2%A6 ' 
인쇄 (parse.unquote (URL))
 "" " 
http://www.baidu.com/s?wd= 중국의 꿈 
" ""

 

추천

출처www.cnblogs.com/angelyan/p/11265614.html