推荐系统之--- 利用用户行为数据

一、用户行为数据

一个用户行为表示为6部分,即产生行为的用户和行为的对象、行为的种类、产生行为的上下文、行为的内容和权重。用户行为的统一表示如下:

user id       产生行为的用户的唯一标识
item id       产生行为的对象的唯一标识
behavior type     行为的种类(比如是购买还是浏览)
context       产生行为的上下文,包括时间和地点等
behavior weight       行为的权重(如果是观看视频的行为,那么这个权重可以是观看时长;如果是打分行为,这个权重可以是分数)
behavior content 行为的内容      (如果是评论行为,那么就是评论的文本;如果是打标签的行为,就是标签)

二、用户行为分析

在利用用户行为数据设计推荐算法之前,研究人员首先需要对用户行为数据进行分析,了解数据中蕴含的一般规律,这样才能对算法的设计起到指导作用。

1、用户活跃度和物品流行度的分布:

很多关于互联网数据的研究发现,互联网上的很多数据分布都满足一种称为Power Law的分布,这个分布在互联网领域也称长尾分布。


猜你喜欢

转载自www.cnblogs.com/Allen-rg/p/11252008.html