LSTM模型结合LDA对序列性文本建模阅读笔记 2017 ICML

其他 2018-06-14 12:07:21 阅读次数: 2

本文作者：合肥工业大学管理学院钱洋 email：[email protected] 内容可能有不到之处，欢迎交流。

未经本人允许禁止转载。

文章来源

Zaheer M, Ahmed A, Smola A J. Latent LSTM Allocation: Joint Clustering and Non-Linear Dynamic Modeling of Sequence Data[C]//International Conference on Machine Learning. 2017: 3967-3976.
论文来自机器学习顶会International Conference on Machine Learning。作者Manzil Zaheer，来自于–卡内基·梅隆大学。作者的主页为:http://www.manzil.ml/

文章简介

神经网络模型RNN，以及改进的LSTM模型(long-shortterm memory)在对序列型数据建模有着很好的效果，例如用户的浏览历史或自然语言文本数据等。并且LSTM模型在训练时需要学习大量的参数，并且可解释性很差，这对用户建模是不太好的。而作者这篇文章是将LSTM模型与贝叶斯模型相结合，提出了一种LLA模型(Latent LSTM Allocation)。在作者的LLA模型中，每个用户可以表示成序列型的actions，模型将群actions映射到主题中并学习主题序列的动态性。通过这种，方式可以增加模型的可解释性、简介性和捕捉复杂的动态性。模型的求解作者使用的是随机EM算法。

论文笔记

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

个人总结

可以将该方法拓展到其他图模型中，再者这个方法可以用来作个性化推荐，具体效果不知道好不好。在作者的文章中，写到了该方法如何对用户的点击行为进行建模并预测用户的下一个点击。
这篇文章并没有提供源码，具体编程细节，需要做这个模型的思考一下。

猜你喜欢

转载自blog.csdn.net/qy20115549/article/details/80564086

LSTM模型结合LDA对序列性文本建模阅读笔记 2017 ICML

（2017 ICML）Learning to learn without gradient descent by gradient descent笔记

ICML 2017 Best Paper理解

（2017ICML Bestpaper）Understanding Black-box Predictions via Influence Functions 笔记

【ICML论文阅读】EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

【ICML论文阅读】EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

论文阅读《2020ICML：Inductive Relation Prediction by Subgraph Reasoning》

Evolution of Image Classifiers，进化算法在神经网络结构搜索的首次尝试 | ICML 2017

ICML 论文阅读(1) Understanding Black-box Predictions via Influence Functions

2017年阅读统计

2017阅读书单

读书笔记14：Graph networks as learnable physics engines for inference and control（ICML 2018）

读书笔记13：Neural relational inference for interacting systems（ICML 2018）

【论文笔记】ICML2016 ＆ Cornell | (IPS-MF) Recommendations as treatments: Debiasing learning and evaluation

清华姚班学生ICML一人署名论文：协作学习的鲁棒性方法

ICML 2018 | 从强化学习到生成模型：40篇值得一读的论文

【多模态】25、ViLT | 轻量级多模态预训练模型（ICML2021）

干货| ICML2023：作为自适应自进化规划器的扩散模型

MEC：Memory-efficient Convolution for Deep Neural Network 深度神经网络中内存高效的卷积算法MEC 论文详解 ICML 2017

ICML 2023 | 复旦和Meta提出Open-VCLIP：兼顾时序建模与开集识别的视频理解模型

2017—论文阅读—分类任务

ICML 2022 | 即插即用！英伟达开源FAN：提升ViT和CNN的鲁棒性和准确性

Stable Diffusion模型阅读笔记

【论文阅读笔记3】序列模型入门之LSTM和GRU

ICML 2022 | 字节跳动 AI Lab 提出多模态模型：X-VLM，学习视觉和语言的多粒度对齐...

ICML 2022｜达摩院多模态模型OFA，实现模态、任务和架构三个统一

ICML 2023杰出论文大幅减少至6篇！北大、武理工校友获奖，大模型水印受青睐

【笔记】HMM模型论文阅读笔记（一）

ICML 2019：序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS | 技术头条...

Matlab 2017a笔记

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)