反爬虫一些问题 - 代码天地

反爬虫一些问题

其他 2020-04-14 22:34:12 阅读次数: 0

1.数据源是什么（数据从哪来）

　　数据，我是通过用户的点击生成的这些行为数据而分析的，用户点击了什么，点击了公司网站，（公司可能是搞高旅游或者是售票之类的），

2.分析了哪些模块以及对应的需求

　　模块这么描述：订单方面的分析，用户方面的分析，商品方面的分析，地址方面的分析，然后就说自己做过哪个模块以及对应的需求

3.基于这些需求的分析，结果的导向是什么

　　最终的目的，通过反爬虫把极其像爬虫的ip过滤出来添加到黑名单，基于这些黑名单来做爬虫的过滤，当黑名单中的爬虫再次请求过来，给它响应一个其它页面，就不会对网站产生影响

　　结果导向：大量爬虫会增加网络流量，增加网站压力，不断的请求导致统计结果有偏差，把爬虫过滤掉，最终分析出该项目推广的力度怎么样，用户对此网站的粘度如何，

　　

猜你喜欢

转载自www.cnblogs.com/zqfdgzrc/p/12701783.html

反爬虫一些问题

使用爬虫遇到的一些问题

一些问题

反爬虫的一些心得

反爬虫的一些措施

Cordova一些问题

Js的一些问题

单链表的一些问题

jquery一些问题

一些问题的积累

eclipse 的一些问题总结

遇到的一些问题

jasperreport一些问题

SVN的一些问题

maven一些问题

svn 初学的一些问题

编译Faban的一些问题

软件测试的一些问题

Faban的一些问题

Solr 的一些问题小结

Flying Saucer一些问题

python遇到的一些问题

fork、vfork的一些问题

linux nginx的一些问题

关于Redis的一些问题

liunx 遇到的一些问题？

PowerDesigner 一些问题

关于Agile的一些问题

Ubuntu安装的一些问题

完成端口的一些问题

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)