해결에 대한 A, reponse
urlopen 반환 객체
(1)의 getURL : 페이지 주소로 반환
(2) 정보 : 오브젝트의 메타 요청 피드백 정보
(3) getcode : HTTP 코드가 반환
에서 URLLIB 수입 요청 수입 chardet "" " 解析reponse " "" 만약 __name__ == " __main__ " : URL = " https://www.baidu.com " RSP = request.urlopen (URL) 인쇄 ( " URL : {0 } " .format (rsp.geturl ())) # 网页地址 인쇄 ( " ================ " ) 인쇄 ( " 정보 : {0} " .format (RSP.정보 ())) #의 페이지 헤더 정보 인쇄 ( " ================ " ) 인쇄 ( " 코드 : {0} " .format (rsp.getcode ())) #의 반환 요청 상태 코드
두, 구문 분석
1.request.date 사용
네트워크에 액세스하는 두 가지 방법
(1) GET을 (2) 포스트
해결 URL로 사용 2.url.parse
from urllib import request,parse import chardet """ 解析reponse """ if __name__ == "__main__": url = "http://www.baidu.com/s?" wd = input("Input your keyword:") #要想使用data,需要使用字典结构 qs = { "wd":wd } #转换url编码 qs = parse.urlencode(qs)#对关键字进行编码 fullurl = url + qs#百度搜索传入的地址是基础地址加上关键字的编码形式 print(fullurl) rsp = request.urlopen(fullurl) html = rsp.read() html = html.decode()#解码 #使用get取值保证不会出错 print(html)
三、源码
Reptile2_ReposeAnlysis.py
https://github.com/ruigege66/PythonReptile/blob/master/Reptile2_ReposeAnlysis.py
2.CSDN:https://blog.csdn.net/weixin_44630050(心悦君兮君不知-睿)
3.博客园:https://www.cnblogs.com/ruigege0000/
4.欢迎关注微信公众号:傅里叶变换,个人公众号,仅用于学习交流,后台回复”礼包“,获取大数据学习资料