php 爬虫框架

发现两款不错的爬虫框架,极力推荐下:

phpspider

一款优秀的PHP开发蜘蛛爬虫

官方下载地址:https://github.com/owner888/phpspider

官方开发手册:https://doc.phpspider.org/

QueryList

使用jQuery选择器来做采集,告别复杂的正则表达式;QueryList具有jQuery一样的DOM操作能力、Http网络操作能力、乱码解决能力、内容过滤能力以及可扩展能力;

可以轻松实现诸如:模拟登陆、伪造浏览器、HTTP代理等意复杂的网络请求;拥有丰富的插件,支持多线程采集以及使用PhantomJS采集JavaScript动态渲染的页面。

官方下载地址:https://github.com/jae-jae/QueryList

官方开发手册:https://doc.querylist.cc/

猜你喜欢

转载自www.cnblogs.com/phpper/p/9649785.html
今日推荐