受到大家公认的推荐算法基本包括以下几种:基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于知识的推荐、组合(混合)推荐及其他推荐
1 基于内容的推荐
基于内容的推荐是根据用户已经选择的对象,从推荐对象中选择其他特征相似的对象作为推荐结果。
(1)这一推荐算法首先提取推荐对象的内容特征,和用户模型中的用户兴趣偏好匹配,匹配度较高的推荐对象就可作为推荐结果推荐给用户。例如音乐的共性,找到用户的兴趣点。然后从其他音乐中选择和用户兴趣点相似的音乐推荐给用户;
(2)关键:计算推荐对象的内容特征和用户模型中兴趣特征二者之间的相似性是该推荐策略中一个关键部分;多媒体信息还没有大量用于基于内容的推荐。
优点
(1)简单、有效,不需要领域知识。(2)不需要历史数据、没有推荐对象冷启动问题稀疏问题
(5)比较成熟的分类学习方法能够为该方法提供支持,如数据挖掘、聚类分析等。
缺点:
(1)推荐对象特征提取能力的限制,多媒体、不同语言兼容问题
(2)很难出现新的推荐结果。、新用户冷启动问题、需要的数据量较大
2协同过滤推荐
一般分为两类:基于用户的协同推荐(或基于内存的协同推荐)、基于项目的协同推荐
3基于关联规则的推荐
以关联规则挖掘算法为基础,把用户已购买(或者喜好)的项目作为规则头,把规则体作为待选推荐对象。
4基于知识的推荐
基于内容的过滤和协同过滤技术若要经过足够数据的训练,基于知识通过推断用户的需要和偏好来作出推荐。不需要大量数据
可分为三类:数据库知识发现KDD、基于案例推理CBR和知识推理KR
5 组合(混合)推荐
目前研究和应用最多的组合推荐是把基于内容的推荐和系统过滤推荐的组合。把它们组合方法根据应用场景不同而不同,主要混合思路有两种:
(1)推荐结果混合:投票机制等
(2)推荐算法的混合:例如协同混合内容、协同混合基于网络结构、社会网络分析法混合基于内容等
离线的推荐算法不同的研究方向的预测准确度指标。
评分预测
预测用户对物品评分的行为称为评分预测。评分预测的预测准确度一般通过均方根误差和平均绝对误差计算。
TopN推荐
主要计算召回率和准确率。准确率就是指我推荐的n个物品中有多少个是对的,其所占的比重。召回率则是指正确结果中有多少比率的物品出现在了推荐结果中。两者的不同就是前者已推荐结果个数当除数,后者已正确结果个数当除数。
4.3 覆盖率4.4 多样性4.5 新颖性4.6 惊喜度4.7 信任度4.8 实时性4.9 健壮性