python 爬虫（二）使用代理模拟浏览器 - 代码天地

python 爬虫（二）使用代理模拟浏览器

其他 2019-01-03 02:35:17 阅读次数: 0

import urllib.request
import random

url = "http://www.baidu.com"

#建立一个代理列表，每次随机使用一个，防止被封IP
agnetsList = [
              "Mozilla/5.0 (iPad; U; CPU OS 4_2_1 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8C148 Safari/6533.18.5"
              "Mozilla/5.0 (iPad; U; CPU OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5"
              "Mozilla/5.0 (Linux; U; Android 2.3.7; en-us; Nexus One Build/FRF91) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1"
              "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36"
              "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36"
              "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 SE 2.X MetaSr 1.0"
              ]

#模拟请求头
headerStr = random.choice(agnetsList)
#header ={"User-Agent":headerStr}

#设置一个请求体
req = urllib.request.Request(url)
req.add_header("User-Agent",headerStr)

#发起请求
response = urllib.request.urlopen(req)

data = response.read().decode("utf-8")
print(data)

猜你喜欢

转载自blog.csdn.net/weixin_40938748/article/details/85276557

python 爬虫（二）使用代理模拟浏览器

python模拟浏览器爬虫之使用代理驱动“谷歌浏览器”

Python爬虫入门<二>—模拟浏览器

python爬虫:使用Selenium模拟浏览器行为

python爬虫:使用Selenium模拟浏览器行为 python爬虫:使用Selenium模拟浏览器行为

python 代理浏览器爬虫资源

Python爬虫：浏览器模拟登录

记忆碎片之python爬虫APP数据爬取之mitmproxy分别代理监听本地浏览器和夜神模拟器（二）

Python使用浏览器模拟访问页面之使用ip代理

python中爬虫库selenium模拟人为使用浏览器基础使用

Python 爬虫更改Headers，替换浏览器信息和使用代理IP。

python爬虫10：使用selenium模拟浏览器登录账号

python爬虫02-使用headers属性模拟成浏览器

python爬虫使用selenium+webdriver模拟浏览器登录

Python爬虫 —— urllib库的使用（get/post请求+模拟超时/浏览器）

[Python 爬虫] 模拟浏览器、代理ip、开启日志、超时处理、异常处理、Get/Post请求等

python爬虫模拟浏览器的两种方法

python urllib模拟浏览器请求爬虫

Python爬虫浏览器自动化模拟

python模拟浏览器爬虫之下拉弹窗

python爬虫模拟浏览器访问-User-Agent

Python爬虫入门5：模拟浏览器访问网站

python爬虫知识点总结（十一）使用Selenium模拟浏览器抓取淘宝商品美食信息

python3爬虫(8)--动态渲染页面使用Selenium库模拟浏览器抓取数据

Python爬虫：Fiddler的使用和浏览器伪装技术

Python爬虫使用浏览器的cookies：browsercookie

Python爬虫使用浏览器cookies：browsercookie过程解析

使用python模拟浏览器实现登陆

Python网络爬虫：自动模拟HTTP请求&爬虫的异常处理&爬虫浏览器伪装技术&新闻爬虫实战

Python实现爬虫设置代理IP和伪装成浏览器的方法分享

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)