机器学习从入门到精通150讲（一）-推荐系统经典模型Wide & Deep（附部分代码） - 代码天地

机器学习从入门到精通150讲（一）-推荐系统经典模型Wide & Deep（附部分代码）

其他 2021-04-04 14:32:18 阅读次数: 0

前言

在大规模特征的场景当中，我们通常（2016年之前）是使用将非线性特征应用在线性模型上的做法来实现的，使用这种方式，我们的输入会是一个非常稀疏的向量。虽然我们要实现这样的非线性特征，通过一些特征转化以及特征交叉的方法是可以实现的，但是这会需要消耗大量的人力物力。
这个问题其实我们之前在介绍FM模型的时候也曾经提到过，对于FM模型来说，其实解决的也是同样的问题。只是解决的方法不同，FM模型的方法是引入一个n x k的参数矩阵V来计算所有特征两两交叉的权重，来降低参数的数量以及提升预测和训练的效率。而在本篇paper当中，讨论的是使用神经网络来解决这个问题。
解决问题的核心在于embedding，embedding直译过来是嵌入，但是这样并不容易理解。一般来说我们可以理解成某些特征的向量表示。比如Word2Vec当中，我们做的就是把一个单词用一个向量来表示。这些向量就称为word embedding。embedding有一个特点就是长度是固定的，但是值一般是通过神经网络来学习得到的。
我们可以利用同样训练embedding的方式来在神经网络当中训练一些特征的embedding，这样我们需要的特征工程的工作量就大大地减少。但是仅仅使用embedding也是不行的，在一些场景当中可能会引起过拟合，所以我们需要把线性特征以及稀疏特征结合起来，这样就可以让模型既不会陷入过拟合，又可以有足够的能力可以学到更好的效果。

简介

正如我们之前文章所分享的一样，推荐系统也可以看成是搜索的排序系统。它的输入是一个用户信息以及用户浏览的上下文信息，返回的结果是一个排好序的序列。
正因为如此，对于推荐系统来说，也会面临一个和搜索排序系统一个类似的挑战——记忆性和泛化性的权衡。记忆

猜你喜欢

转载自blog.csdn.net/m0_50230964/article/details/114685592

机器学习从入门到精通150讲（一）-推荐系统经典模型Wide & Deep（附部分代码）

推荐系统入门（四）：Wide&Deep（附代码）

如何入门到精通机器学习之概率图模型【附资源推荐】

深度学习推荐模型-Wide&Deep

推荐系统 - Wide & Deep

「从零入门推荐系统」13：推荐系统排序算法之wide & deep、YouTube深度学习排序...

链表经典问题(附部分代码和测试)

栈经典问题（附部分代码和测试）

【推荐系统】wide&deep模型、NeuralCF模型笔记

基于Transformer的交通预测模型部分汇总【附源代码】

深度学习推荐系统(四)Wide&Deep模型及其在Criteo数据集上的应用

Deep&Wide推荐系统

基于深度学习模型Wide&Deep的推荐

深度学习在美团点评推荐平台排序中的应用&& wide&&deep推荐系统模型--学习笔记

推荐系统组队学习之Wide&Deep

推荐系统CTR实战——Wide & Deep

wide & deep 应用于推荐系统

二叉树的经典问题（附部分代码和测试）

【CMake 入门与进阶（6）】 CMakeLists.txt 部分常用变量（附使用代码）

【CMake 入门与进阶（7）】 CMakeLists.txt 部分常用变量-续（附使用代码）

PyTorch从入门到精通100讲（五）-Pytorch Geometric 从原理到实战应用案例（附代码）

（读论文）推荐系统之ctr预估-Wide＆Deep模型解析

【机器学习】推荐算法(附例题代码)

Wide&Deep 模型学习教程

wide & deep 模型

Wide & Deep模型

机器学习算法&推荐系统算法精讲+机器学习+代码+PPT(完整版)

Java学习从入门到精通(附FAQ)

Django从入门到精通-Django实现静态页面(附代码)

【CMake 入门与进阶（3）】 CMakeLists.txt 语法规则基础及部分常用指令（附使用代码）

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)