在公司做分布式深网爬虫,搭建一套稳定的代理池服务,为成千上万的爬虫提供有效的代理,保证每个爬虫都能获得相应网站的有效代理IP,从而保证爬虫的快速稳定运行。当然,公司做的事情不能开源。但是闲暇时手痒,想用一些免费资源做一个简单的代理池服务。
turtle库概况:
turtle库是绘图系统python的实现;
python标准库之一的turtle库属于初级图形绘制函数库。
- 标准库:它是一个功能模块,直接与解释器一起安装在操作系统中;
- 第三方库:需要安装的功能模块;
- 图书馆:library,package包,module模块统称为模块;
图库绘图原理:有一只龟在图板正中,在画布上漫步,走过的轨迹构成绘图图,龟受程序控制,可以自由改变颜色,方向宽度等;
其次,turtle绘制窗口:
turtle.setup(width,height,startx,starty)
#setup设置窗体大小,四个参数中后两个参数非必选参数;
#setup()是非必须的;
指令的详细说明
Python爬虫代理区分高匿和透明的。一个透明代理将显示http启动器的IP地址。
使用Python代码或http工具启动的http返回的都是电脑上的IP。
turtle.circle(radius,extent=None,steps=None)
说明:根据给定的半径画圆。
要素:
拉迪乌斯(半径);半径为正(负),表示在笔刷的左边(右边)画圆。
扩展(弧度)(optional);
圆周(optional)(圆周半径为radius且多边形边数为steps的内切正多边形)
代理ip的应用:
外部接口,因为现在代理池功能非常简单,花两个小时查看Flask,然后决定使用Flask解决这个问题。该功能提供了像get/delete/refresh这样的接口,方便爬虫直接使用。
用Python简单绘制代码:
#PythonDraw.py
import turtle as tu
tu.setup(650,350,200,200)
tu.penup()
tu.fd(-250)
tu.pendown()
tu.pensize(25)
tu.seth(-40)
for i in range(4):
tu.pencolor("yellow")
tu.circle(40,80)
tu.pencolor("gold")
tu.circle(-40,80)
tu.circle(40,80/2)
tu.fd(40)
tu.circle(32,180)
tu.fd(40*2/3)
tu.done()
如需完整代理,加抠裙
文章部分内容源于网络,联系侵删*