为期一周的人工智能和机器学习领域顶级会议NeurIPS已于当地时间12月16日圆满结束。蚂蚁集团有20篇论文被本届会议收录，其中《Prompt-augmentedTemporalPointProcessforStreamingEventSequence》由蚂蚁集团研究并撰写，作者包括薛思乔、王言、褚志轩、师晓明、蒋才高、郝鸿延、蒋刚玮、冯晓云、JamesY.Zhang、周俊。

作者简介：薛思乔是这篇论文的主要作者，也是蚂蚁集团高级算法专家，主要研究方向是生成式序列模型(sequentialmodeling)，他的研究成果曾多次发表于主流机器学习相关会议(NeurIPS/ICML/AAAI)。最近一年团队的主要工作聚焦于大语言模型与时间序列的交叉方向，在NeurIPS'23发表了事件序列预测模型的持续学习方法"PromptTPP"以及利用大语言模型支持事件序列预测的方法"LAMP"两篇论文。

本文中，薛思乔会带大家了解论文《Prompt-augmentedTemporalPointProcessforStreamingEventSequence》的背景和主要研究成果，完整论文可点击阅读原文查看。

01 背景和动机

时间序列模型通常用于分析和预测具有明显时间顺序特征的序列数据。这些场景包括但不限于：

金融市场分析与预测:如股票价格、汇率、商品期货等时间序列数据的趋势预测。
交通流量和运输:预测车辆的行驶情况，从而改进城市交通规划和运营管理。

在真实的商业场景中，时间序列（本文特指事件序列,eventsequence）通常是以流式(stream)的形式存在并且不断更新的。对这样的数据建模，我们通常有以下几个方法（图一）：

预训练一个点过程模型，然后不再更新：最简单粗暴，但是因为它们在被部署后不会再进行学习或更新，从而导致它们在面对新的或者未见过的数据时性能下降，因为这些数据可能与训练集有所不同（这种现象称为分布漂移）。
每隔一段时间，针对固定窗口的数据重新训练一次点过程模型：这个方法会遇到灾难性遗忘的问题（图二），即忘记过去任务的重要信息。
点过程模型的在线学习版本：模型的维护并不容易，而且也会遇到灾难性遗忘的问题。

在这样的背景下，我们如何能更有效率、更有效果的进行模型的持续学习？我们在文章中Prompt-augmentedTPP尝试解答了这个问题，并且被NeurIPS'23接收。

图1：主要方法的示意图

图2：在开源数据集事件序列上做的数据分析

02 问题定义

我们首先定义任务：与NLP领域不同，我们沿着时间轴定义任务(task)，以及任务的训练、验证和测试流程。然后，我们的问题是，一个点过程模型应该如何持续学习，使得它可以既能够及时适应分布变化，同时避免灾难性遗忘。另外，我们希望这个新的方法有足够的实用性，即是taskagnositic的，不需要保存任务的信息（比如事件序列中事件的属性信息）即可进行预测。taskagnostic是持续学习方向常见的诉求，这种方法更有效率，而且也能满足隐私保护的要求（比如不能存储某些属性信息）。