CAN: Revisiting Feature Co-Action for Click-Through Rate Prediction

作者关于论文发的一些想法
https://zhuanlan.zhihu.com/p/287898562

ABSTRACT

受深度学习成功的启发,最近的工业点击率(CTR)预测模型已经从传统的浅层方法过渡到深度方法。深度神经网络(DNNs)具有从原始特征中自动学习非线性交互作用的能力,然而,非线性特征交互作用是以隐式方式学习的。这种非线性的交互作用可能很难捕捉并显式建模,原始特征的交互作用有利于CTR预测,协同作用指的是特征对最终预测的集体影响。在这篇文章中,我们认为目前的CTR模型没有充分挖掘特征共同作用的潜力。我们进行了实验,结果表明特征协同作用的效果被严重低估。基于我们的观察,我们提出了特征协同作用网络(CAN)来挖掘特征协同作用的潜力。该模型能够高效、有效地捕捉特征间的相互作用,在降低存储和计算消耗的同时,提高了模型的性能。在公共和工业数据集上的实验结果表明,该算法的性能明显优于最先进的CTR模型。到目前为止,CAN已经部署在阿里巴巴展示广告系统中,在CTR和RPM上分别获得了12%和8%的平均提升

1 INTRODUCTION

随着机器学习模型的日益复杂,尤其是推荐系统中的模型,如何有效、高效地处理丰富的输入特征成为一个关键问题。对于工业环境下的在线推荐,模型经常被训练成亿级规模的二值化稀疏特征,并使用一次热编码[3,22]。每个特征也可以看作一个唯一的ID,它首先映射到一个低维嵌入,然后再输入到模型中。处理大规模输入的一种简单方法是将每个特征视为独立的。在此假设下,特征之间不存在连接,从而可以直接训练广义线性模型以基于特征的组合(例如,串联)来估计点击率。
然而,推荐系统中的“推荐项目”和“用户点击历史”等特征是高度相关的[

猜你喜欢

转载自blog.csdn.net/qq_39091546/article/details/113643574