I. 서론
URL이 추출 URL의 다양한 달성하기 위해 표준 인터페이스를 정의
구문 분석 모듈 동작 : URL을 합하고, 부호화 복호화 파싱
둘째, 코드
방법 1 : urlparse
식별 및 실현 URL의 분할
에서 URLLIB 가져 오기 구문 분석 URL = ' https://www.cnblogs.com/angelyan/ ' "" " URL : URL의 해결 방식을 = '': URL이 프로토콜을 구문 분석하지 않는 경우가있는 경우, 기본 프로토콜이 제공 될 수있다 URL 프로토콜 설정이 매개 변수가 잘못 앵커를 무시할지 여부, 그들은 기본이 생략, 허위 사실이다 무시하지 않았다 : allow_fragments = TRUE "" " 결과 = parse.urlparse (URL = URL, 계획을 = ' HTTP ' , allow_fragments은 = 참) 인쇄 (결과) 인쇄 (result.scheme) "" " (= 계획 'HTTPS', netloc = 'www.cnblogs.com을'경로 = '/ angelyan /'엔 params = '', 쿼리 = '', 조각 = ' ') 방식 : 프로토콜을 나타냅니다 netloc를 :도메인 이름 경로 : 경로 PARAMS : 매개 변수 쿼리 : 쿼리, URL은 일반적으로 요청받을 조각 : 직접 등록 페이지에 대한 앵커 표면의 풀다운 위치를 페이지에 지정된 위치로 이동 "" "
방법 2 : urlunparse
URL 구조가 달성 될 수있다
= url_parmas ( ' HTTPS ' , ' www.cnblogs.com ' , ' /은 / angelyan ' , '' , ' 이름 = 메이플 ' , ' 로그 ' ) #의 구성 요소 :. 반복자 객체는 길이 6 있어야합니다 결과 = 구문 분석 .urlunparse (url_parmas) 인쇄 (결과) "" " https://www.cnblogs.com/angelyan/?name=maple#log " ""
방법 세 : urljoin
연결 기반 전송, 기지국은 어느 한 링크 불완전한 접합에 접속 될 수있다 전체 링크 인
BASE_URL = ' https://www.cnblogs.com ' sub_url = ' / angelyan / 이름 = 메이플 # 로그? ' full_url = parse.urljoin (BASE_URL, sub_url) 인쇄 (full_url) "" " HTTPS : //www.cnblogs .COM / angelyan /? 이름 = 메이플 # 로그 "" "
방법 사 :를 urlencode
GET 및 사후 요청을 구성하는 데 사용되는 URL 문자열 요청 매개 변수를 코딩 사전에 매개 변수의 순서 후
parmas = { ' 이름 ' : ' 메이플 ' , ' 나이 ' : 18이다 } parmas_str = parse.urlencode (parmas) 인쇄 (parmas_str) "" " 이름 = 메이플 & 나이 = 18입니다 " "" parmas_str = ' = 18 이름 = 메이플 & 나이 ' # URL 파라미터 인코딩 형식 직렬화 사전 parmas = parse.parse_qs (parmas_str) 전단 (parmas) "" " { '이름': '메이플', '연령'['18 인 ']} " " "
방법 오 : 인용
당신은 URL에 대한 중국어 인코딩 형식을 변환 할 수 있습니다
= 말씀 ' 중국의 꿈 ' URL = ' http://www.baidu.com/s?wd= ' + parse.quote (워드) 인쇄 (parse.quote (워드)) 인쇄 (URL) "" " %의 E4의 % 는 AD E5 %%% B8 9B는 BD %의 A2 %%% E6 A6 http://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD%E6%A2%A6 "" " #의 인용을 끝내 : 디코딩 할 수있는 인코딩 된 URL URL을 = ' http://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD%E6%A2%A6 ' 인쇄 (parse.unquote (URL)) "" " http://www.baidu.com/s?wd= 중국의 꿈 " ""