PHP编写爬虫参考

phpQuery
PHP Simple HTML DOM Parser
phpQueryList
php snoopy
PhantomJS 
1 、 Guzzle :功能很完善的 httpclient ,带异步并发功能,别的脚本语言找不到这么好的 httpclient

2 、 Goutte :对 symfony 的 dom-crawler 和 css-selector 的简单封装,你也可以直接用 symfony 的 css-selector 来抽取 html 的 dom 元素

3 、 symfony/process : symfony 出品的 php 开进程的库(封装的 proc_open ),兼容 windows ,要知道 pcntl 扩展不支持 windows 的

4 、 php-webdriver : Facebook 官方维护的 selenium 的 php 客户端
 

猜你喜欢

转载自blog.csdn.net/taian1665/article/details/81335603