A Scalable Probabilistic Tensor Factorization(SPTF)论文小结

SPTF具体来说还是基于张量分解TF的一种方法,同时也还是基于score learning的。

介绍

用户历史行为可以被分为两种类型: 显示反馈(explicit feedback)和隐式反馈(implicit feedback). explicit feedback包括用户关于他们感兴趣的item的显示输入,主要体现在对item的rating(评分)。但是explicit feedback并不总是能够获得。更多的情况下,隐式评分通过用户的行为例如点击或不点击,买或不买等表达出来,这些更容易常见也更容易获得。关于implicic feedback的一个缺陷就是只有正反馈我们才能观察到(比如user点击了某件item,或者购买了item等,对于不点击和不购买我们无法获知,且那些negative中并不是所有的都是对此不感兴趣,也可能user暂时不买,以后会买等)。 仅仅根据上面所说的正样例或者可观察到的协同过滤(CF)我们成为one-class Collaborative Filtering(OCCF).
现在很多工作集中在同质的用户行为上,并没有考虑到现实世界中用户行为的多样性和异质性。比如,典型的电商平台中用户的行为类型最少有四种(点击,加入购物车,收藏,购买)。不同的用户行为类型暗示着不同的语义和用户意图。人们和item交互的方式在理解用户意图和建模用户兴趣时是关键。也就是说我们关注的不是用户和什么交互了,而是用户怎样和item交互。另外,在单一行为类型上的(例如购买)用户隐式反馈数据是很稀疏的,因此,必须集体利用丰富的异构行为数据来增强每种类型的行为预测,尤其是对稀疏行为类型的预测(例如,购买预测)。
在这个论文中作者提出了SPTF模型,每个用户行为记录都是三元组(user,type,item)表示而不是二元组,我们区分不同的行为类型因为他们传达了不同的语义。SPTF为每个user,item,type学习潜在的向量表示。张量是对象之间多种关系的有用方式,张量因子分解被视为预测未来他们可能关系的重要手段。但是现存的TF模型如BPTF何RESCAL忽视了所有的未观察的样本,正如MF对explicit feedback

猜你喜欢

转载自blog.csdn.net/HowardEmily/article/details/105647699
今日推荐