自然语言处理--聊天机器人的自然语言流水线

聊天机器人需要 4 个处理阶段和一个数据库来维护过去语句和回复的记录。
这 4 个处理阶段中的每个阶段都可以包含一个或多个并行或串行工作的处理算法(如下图):
(1)解析:从自然语言文本中提取特征、结构化数值数据。
(2)分析:通过对文本的情感、语法合法度及语义打分,生成和组合特征。
(3)生成:使用模板、搜索或语言模型生成可能的回复。
(4)执行:根据对话历史和目标,规划相应语句,并选择下一条回复。
上述 4 个阶段中的每个阶段都可以使用框图中相应框中列出的一个或多个算法来实现。

一个数据库:
显式地调用了一个数据库来于记录每个阶段所需的数据,并随着时间的推移保存这些阶段的配置和训练集。这可以在聊天机器人与外界进行交互时对每个阶段进行批量或在线再训练。

此外我们还在生成的文本回复上给出了一个反馈循环,以便使用与处理用户语句相同的算法来处理我们的回复。然后,根据聊天机器人的对话规划或目标,将回复的得分或特征融合到一个目标函数中,以评估和选择可能的最佳回复

在这里插入图片描述

NLP 流水线中的示例层:
前四层对应于上图聊天机器人流水线中的前两个阶段(特征提取和特征分析)。
底部的两层(实体关系和知识库)用于构成包含特定领域信息(知识)的数据库。
在这里插入图片描述
使用所有这 6 层从特定语句或文档中提取的信息可以与该数据库结合使用进行推理。这里的推理结果是从环境中检测到的一组条件中进行的逻辑推理,就像聊天机器人语句中包含的逻辑一样。图中较深层的这种推理机被认为属于人工智能的领域,机器可以对它们的世界进行推理,并使用这些推理结论做出逻辑决策。

猜你喜欢

转载自blog.csdn.net/fgg1234567890/article/details/114241130