【AI知识点】束搜索（Beam Search）

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】

束搜索（Beam Search） 是一种常用于序列生成任务的启发式搜索算法，广泛应用于自然语言处理中的机器翻译、文本生成等任务。它是一种平衡了搜索效率和搜索质量的方法，相比于贪心搜索，它能找到更优的解，但计算复杂度比穷举搜索更低。

束搜索是一种宽度受限的最优搜索方法，在生成序列时，它会同时保留多个最优候选，而不是只关注当前最优的选择。具体来说，束搜索会保留固定数量的候选序列，这被称为束宽（beam width or beam size），并在每一步扩展这些候选序列，最终从中选择得分最高的一个作为结果。

假设我们有一个简单的语言模型要生成句子，模型根据之前的词生成下一个词的概率。以下是一个生成句子的例子，束宽为 2（即每一步保留两个最优候选）：

模型预测三个可能的词：

选择得分最高的前两个候选，“我”和“你”。

对于“我”，模型预测：

对于“你”，模型预测：

选择得分最高的前两个候选：

束搜索在以下场景中应用广泛：

束搜索的计算复杂度主要由以下几个因素决定：

在每一步，束搜索从 $k$ 个候选序列中分别扩展 $V$ 个新词，因此单步的计算复杂度为 $\cdot V)$ 。在整个生成序列的过程中，束搜索需要进行 $T$ 步扩展，因此，束搜索的总计算复杂度为：
$\cdot V \cdot T)$

假设我们有以下参数：

那么，束搜索的总计算复杂度将是：
$\cdot 10,000 \cdot 20) = O(1,000,000)$

束搜索是一种在序列生成任务中用于平衡搜索效率和准确性的算法，它通过同时保留多个候选序列，能够避免局部最优解问题。其束宽决定了搜索范围和计算复杂度，广泛应用于机器翻译、文本生成和语音识别等任务。