1 urllib.parse
urllib 库中包含有如下内容
Package contents
error
parse
request
response
robotparser
其中urllib.parse主要是用来解析URL(统一资源定位器)的。
urllib.parse模块定义了一个标准接口,将统一资源定位器URL字符串拆分为诸如addressing scheme、网址、路径等组件;该模块也可以将相对URL(relative URL)转换为给定的基URL(base URL)的绝对URL(absolute URL)。
urllib.parse被设计成在相对统一资源定位器(relative uniform resource locators)上与互联网RFC相匹配,它支持的URL schemes(URL协议)如下:
file、 ftp、gopher、hdl、http、 https、imap、 mailto、 mms、news、nntp、 prospero、rsync、rtsp、 rtspu、 sftp、 shttp、 sip、 sips、 snews、svn、svn+ssh、 telnet、 wais、 ws、wss。
Python中的urllib.parse模块提供的方法可以分为两种:
网址解析(URL parsing):将URL字符串拆分为其组件
网址引用(URL quoting):将URL组建组合到URL字符串中