Python爬虫教程-11-proxy代理IP,隐藏地址(猫眼电影)

                       

Python爬虫教程-11-proxy代理IP,隐藏地址(猫眼电影)

ProxyHandler处理(代理服务器),使用代理IP,是爬虫的常用手段,通常使用UserAgent 伪装浏览器爬取仍然可能被网站封了IP,但是我们使用代理IP就不怕它封了我们的IP了

获取代理IP的的网站:

  • www.goubanjia.com
  • www.xicidaili.com
  • 使用代理来隐藏真实访问中,代理也不允许频繁访问某一个固定网站,所以,代理一定要很多很多
  • 需要使用,从上面的网站拷贝

基本使用步骤

# 使用代理服务器访问猫眼# https://maoyan.com/from urllib import request,errorif __name__ == '__main__':    url = "https://baidu.com/"    # 1.设置代理地址    proxy = {'http': '218.60.8.83:3129'}    # 2.创建ProxyHandler    proxy_handler = request.ProxyHandler(proxy)    # 3.创建Opener    opener = request.build_opener(proxy_handler)    # 4.安装Opener    request.install_opener(opener)    # 下面再进行访问url就会使用代理服务器    try:        rsp = request.urlopen(url)        html = rsp.read().decode()        print(html)    except error.HTTPError as e:        print(e)    except Exception as e:        print(e)
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28

运行结果

这里写图片描述
关于爬虫使用代理服务器,使用代理IP,就介绍到这里了,使用代理IP是爬虫的常用手段,好处多多

更多文章链接:Python 爬虫随笔


- 本笔记不允许任何个人和组织转载

           

猜你喜欢

转载自blog.csdn.net/qq_44906554/article/details/89280524
今日推荐