设计可用特征用于区分网络用户为网吧用户还是家庭用户?

1、问题

一个有意思的业务题,给一批用户数据,每条数据由网络IP和该条上网记录的时时间戳组成;如何设计可用特征,用于区分此批数据是属于网吧用户还是家庭用户?

2、部分思路

(1)最直观的可从原始数据中获取用户上网集中时间情况,一般而言,家庭用户较为集中在某些时间点(如晚上),而网吧用户则全天候都很有可能在使用,这是一个较有区分性的特征;

(2)从外部信息中挖掘,可挖掘网速这个特征;一般而言网吧的网速优于大部分的普通家庭用户;

(3)从网络用户行为入手,如统计网络用户的年龄,或利用用户的上网内容,如网吧用户很可能访问较多的是游戏网站,而家庭用户可能访问较多网页或视频网站。

可参考资料:

移动互联网时代的用户上网行为分析浅谈 

 

猜你喜欢

转载自www.cnblogs.com/xieb1994/p/10016995.html
今日推荐