5. 维特比算法解码隐藏状态序列 $Q$

学习目标：

知道维特比算法解码隐藏状态序列 $Q$

在本篇我们会讨论维特比算法解码隐藏状态序列 $Q$ ，即给定模型 $\lambda$ 和观测序列 $O$ ，求给定观测序列 $O$ 条件下，最可能出现的对应的隐藏状态序列 $Q^*$ 。

HMM 模型的解码问题最常用的算法是维特比算法，当然也有其他的算法可以求解这个问题。同时维特比算法是一个通用的求序列最短路径的动态规划算法，也可以用于很多其他问题。

5.1 HMM 最可能隐藏状态序列求解概述

HMM 模型的解码问题即：

给定模型 $\lambda=(A,B,\Pi)$ 和观测序列 $O = o_1,o_2, ..., o_T$ ，求给定观测序列 $O$ 条件下，最可能出现的对应的隐藏状态序列 $Q^*=q^*_1, q^*_2, ...， q^*_T$ ，即 $P(Q^*|O)$ 的最大化。

一个可能的近似解法是求出观测序列 $O$ 在每个时刻 $t$ 最可能的隐藏状态 $q^*_t$ ，然后得到一个近似的隐藏状态序列 $Q^*=q^*_1, q^*_2, ...， q^*_T$ 。要这样近似求解不难，利用前向后向算法评估观察序列概率的定义：

在给定模型 $\lambda$ 和观测序列 $O$ 时，在时刻 $t$ 处于状态 $q_i$ 的概率是
$\gamma_t(i)$ ，这个概率可以通过 HMM 的前向算法与后向算法计算。这样我们就有：

$Q^*_t = \underset{i \le i \le N}{\mathrm{arg max}} \r(i) \quad t = 1, 2, ..., T$

其中：

$A$ ：状态转移矩阵，其中 $a_{ij}$ 表示从隐藏状态 $i$ 转移到隐藏状态 $j$ 的概率。
$B$ ：观测概率矩阵，其中 $b_j(k)$ 表示在隐藏状态 $j$ 下观测到符号 $k$ 的概率。
$\Pi$ ：初始状态概率向量，其中 $\pi_i$ 表示初始时刻隐藏状态为 $i$ 的概率。
$O$ ：观测序列，其中 $o_t$ 表示时刻 $t$ 的观测值。
$\lambda$ ：HMM 模型参数，包括状态转移矩阵 $A$ 、观测概率矩阵 $B$ 和初始状态概率向量 $\Pi$ 。
$Q^*$ ：最可能的隐藏状态序列（即预测的隐藏状态序列），其中 $q^*_t$ 表示时刻 $t$ 最可能的隐藏状态。
$\gamma_t(i)$ ：在给定模型 $\lambda$ 和观测序列 $O$ 时，在时刻 $t$ 处于状态 $q_i$ 的概率。

近似算法很简单，但是却不能保证预测的状态序列 $Q^*$ 整体是最可能的状态序列 $Q_{\text{best}}$ ，因为预测的状态序列 $Q^*$ 中某些相邻的隐藏状态 $q$ 可能存在转移概率 $a_{ij}$ 为 0 的情况。

而维特比算法可以将 HMM 的状态序列作为一个整体来考虑，避免近似算法的问题，下面我们来看看维特比算法进行 HMM 解码的方法。

5.2 维特比算法概述

维特比算法是一个通用的解码算法，是基于动态规划的求序列最短路径的方法。既然是动态规划算法，那么就需要找到合适的局部状态，以及局部状态的递推公式。

在 HMM 中，维特比算法定义了两个局部状态用于递推：

【第一个局部状态 $\delta_t(q)$ 】第一个局部状态是在时刻 $t$ 隐藏状态为 $q$ 所有可能的状态转移路径 $q_1,q_2, ..., q_t$ 中的概率最大值，记为 $\delta_t(q)$ ：

$\delta_t(q) = \underset{q_1, q_2, ..., q_{t-1}}{\max}P(q_t = q, q_1, q_2, ..., q_{t-1}, o_t, o_{t-1}, ..., o_1|\lambda) \quad i = 1, 2, ..., N$

由 $\delta_t(q)$ 的定义可以得到 $\delta$ 的递推表达式：

$\begin{aligned} \delta_{t+1}(q) & = \underset{q_1, q_2, ...,q_t}{\max}P(q_{t+1} = q, q_1, q_2, ..., q_t, o_{t+1}, o_t, ..., o_1 | \lambda)\\ &= \underset{1\le j \le N}{\max}[\delta_t(j)a_{ji}]b_{i}(o_{t+1}) \end{aligned}$

【第二个局部状态 $\psi_t(q)$ 】第二个局部状态由第一个局部状态递推得到。

我们定义在时刻 $t$ 隐藏状态为 $q$ 的所有单个状态转移路径 $q_1,q_2, ..., q_{t-1})$ 中概率最大的转移路径中第 $t - 1$ 个节点的隐藏状态为 $\psi_t(q)$ 。其递推表达式可以表示为：

$\psi_t(q) = \underset{1 \le j \le N}{\text{argmax}}[\delta_{t-1}(j)a_{ji}]$

有了这两个局部状态，我们就可以从时刻 0 一直递推到时刻 $T$ ，然后利用 $\psi_t(i)$ 记录的前一个最可能的状态节点回溯，直到找到最优的隐藏状态序列。

其中：

$A$ ：状态转移矩阵，其中 $a_{ij}$ 表示从隐藏状态 $i$ 转移到隐藏状态 $j$ 的概率。
$B$ ：观测概率矩阵，其中 $b_j(k)$ 表示在隐藏状态 $j$ 下观测到符号 $k$ 的概率。
$\Pi$ ：初始状态概率向量，其中 $\pi_i$ 表示初始时刻隐藏状态为 $i$ 的概率。
$O$ ：观测序列，其中 $o_t$ 表示时刻 $t$ 的观测值。
$\lambda$ ：HMM 模型参数，包括状态转移矩阵 $A$ 、观测概率矩阵 $B$ 和初始状态概率向量 $\Pi$ 。
$\delta_t(q)$ ：在时刻 $t$ 隐藏状态为 $q$ 的所有可能的状态转移路径中的概率最大值。
$\psi_t(q)$ ：在时刻 $t$ 隐藏状态为 $q$ 的所有单个状态转移路径中概率最大的转移路径中第 $t - 1$ 个节点的隐藏状态。

维特比算法通过动态规划来求解最优状态序列，具有较高的效率和准确性。

5.3 维特比算法流程总结

输入：HMM 模型 $\lambda = (A, B, \prod)$ ，观测序列 $O = (o_1, o_2, ..., o_T)$
输出：最有可能的隐藏状态序列 $Q^* = q^*_1, q^*_1,..., q^*_T$

流程如下：

步骤一：初始化局部状态

$\begin{aligned} & \delta_1(q) = \Pi_i b_i (o_1) \quad i = 1, 2, ..., N\\ & \psi_1(q) = 0 \quad i = 1, 2, ..., N \end{aligned}$

步骤二：进行动态规划递推时刻 $t = 2, 3, ..., T$ 的局部状态

$\begin{aligned} & \delta_t(q) = \underset{1 \le j \le N}{\max}[\delta_{t-1}(j)a_{ji}]b_i(o_t) \quad & i = 1, 2, ..., N\\ & \psi_t(i) = \underset{1 \le j \le N}{\text{argmax}}[\delta_{t-1}(j)a_{ji}] \quad & i = 1, 2, ..., N \end{aligned}$

步骤三：计算时刻 $T$ 最大的 $\delta_T(i)$ ，即为最可能隐藏状态序列出现的概率。计算时刻 $T$ 最大的 $\psi_t(q)$ ，即为时刻 $T$ 最可能的隐藏状态。

$\begin{aligned} & P^* = \underset{1 \le j \le N}{\max} \delta_T(i)\\ & q^*_T = \underset{1 \le j \le N}{\text{argmax}}[\delta_T(q)] \end{aligned}$

步骤四：利用局部状态 $\psi_t(i)$ 开始回溯。对于 $t = T - 1, T - 2, ..., 1$ ：

$q^*_t = \psi_{t+1}(q^*_{t+1})$

最终得到最有可能的隐藏状态序列 $Q^* = q^*_1, q^*_2, ..., q^*_T$ 。

其中：

$A$ ：状态转移矩阵，其中 $a_{ij}$ 表示从隐藏状态 $i$ 转移到隐藏状态 $j$ 的概率。
$B$ ：观测概率矩阵，其中 $b_j(k)$ 表示在隐藏状态 $j$ 下观测到符号 $k$ 的概率。
$\Pi$ ：初始状态概率向量，其中 $\pi_i$ 表示初始时刻隐藏状态为 $i$ 的概率。
$O$ ：观测序列，其中 $o_t$ 表示时刻 $t$ 的观测值。
$\lambda$ ：HMM 模型参数，包括状态转移矩阵 $A$ 、观测概率矩阵 $B$ 和初始状态概率向量 $\Pi$ 。
$\delta_t(q)$ ：在时刻 $t$ 隐藏状态为 $q$ 的所有可能的状态转移路径中的概率最大值。
$\psi_t(q)$ ：在时刻 $t$ 隐藏状态为 $q$ 的所有单个状态转移路径中概率最大的转移路径中第 $t - 1$ 个节点的隐藏状态。

5.4 HMM 维特比算法求解实例

下面我们仍然用盒子与球的例子来看看 HMM 维特比算法求解。我们的观察集合是：

$\begin{aligned} & V = \{ 红,白 \}\\ & M = 2 \end{aligned}$

我们的状态集合是：

$\begin{aligned} & Q = \{盒子1, 盒子2, 盒子3\}\\ & N = 3 \end{aligned}$

而观察序列 $O$ 和状态序列 $i$ 的长度为都为 3。

初始状态分布为：

$\Pi = (0.2, 0.4, 0.4)^T$

状态转移概率分布矩阵 $A$ （不可见的，隐含的）为：

$\begin{bmatrix} 0.5 & 0.2 & 0.3\\ 0.3 & 0.5 & 0.2\\ 0.2 & 0.3 & 0.5 \end{bmatrix}_{N \times N = 3 \times 3}$

行表示第几次抽球（从2开始）；列表示使用第几个盒子的概率

观测状态概率矩阵 $B$ （可见的）为：

$\begin{bmatrix} 0.5 & 0.5\\ 0.4 & 0.6\\ 0.7 & 0.3 \end{bmatrix}_{N \times M = 3 \times 2}$

行代表第几个盒子；列1代表红球的概率，列2代表白球的概率

球的颜色的观测序列：

$O = \{红, 白, 红\}$

按照我们前面的维特比算法，首先需要得到三个隐藏状态在 时刻1 时对应的各自两个局部状态，此时观测状态为 1：

$\begin{aligned} & \delta_1(1) = \Pi_1b_1(o_1) = \underset{第一个盒子}{0.2} \times \underset{红球}{0.5} = 0.1\\ & \delta_1(2) = \Pi_2b_2(o_1) = \underset{第二个盒子}{0.4} \times \underset{红球}{0.4} = 0.16\\ & \delta_1(3) = \Pi_3b_3(o_1) = \underset{第三个盒子}{0.4} \times \underset{红球}{0.7} = 0.16\\ & \psi_1(1) = \psi_1(2) = \psi_1(3) = 0 \end{aligned}$

$\psi_1(1) = \psi_1(2) = \psi_1(3) = 0$ 是因为初始化设定它们为 0

现在开始递推三个隐藏状态在 时刻2 时对应的各自两个局部状态，此时观测状态为 2：

$\begin{aligned} & \delta_2(1) = \underset{1 \le j \le 3}{\max}[\delta_1(j)a_{j1}]b_1(o_2) = \underset{1 \le j \le 3}{\max}[\underset{第一种情况}{\underline{\underset{上一次是盒子1}{0.1} \times \underset{盒子1\rightarrow盒子1}{0.15}}}, \underset{第二种情况}{\underline{\underset{上一次是盒子2}{0.16} \times \underset{盒子2\rightarrow盒子1}{0.3}}}, \underset{第三种情况}{\underline{\underset{上一次是盒子3}{0.28} \times \underset{盒子3\rightarrow盒子1}{0.2}}}] \times \underset{白球}{0.5} = 0.028\\ & \qquad \psi_2(1) = \underset{最大值对应的索引(从1开始)}{3}\\ & \delta_2(2) = \underset{1 \le j \le 3}{\max}[\delta_1(j)a_{j2}]b_2(o_2) = \underset{1 \le j \le 3}{\max}[\underset{第一种情况}{\underline{\underset{上一次是盒子1}{0.1} \times \underset{盒子1\rightarrow盒子2}{0.2}}}, \underset{第二种情况}{\underline{\underset{上一次是盒子2}{0.16} \times \underset{盒子2\rightarrow盒子2}{0.5}}}, \underset{第三种情况}{\underline{\underset{上一次是盒子3}{0.28} \times \underset{盒子3\rightarrow盒子2}{0.3}}}] \times \underset{白球}{0.6} = 0.0504\\ & \qquad \psi_2(2) = \underset{最大值对应的索引(从1开始)}{3}\\ & \delta_2(3) = \underset{1 \le j \le 3}{\max}[\delta_1(j)a_{j3}]b_3(o_2) = \underset{1 \le j \le 3}{\max}[\underset{第一种情况}{\underline{\underset{上一次是盒子1}{0.1} \times \underset{盒子1\rightarrow盒子3}{0.3}}}, \underset{第二种情况}{\underline{\underset{上一次是盒子2}{0.16} \times \underset{盒子2\rightarrow盒子3}{0.2}}}, \underset{第三种情况}{\underline{\underset{上一次是盒子3}{0.28} \times \underset{盒子3\rightarrow盒子3}{0.5}}}] \times \underset{白球}{0.3} = 0.042\\ & \qquad \psi_2(3) = \underset{最大值对应的索引(从1开始)}{3}\\ \end{aligned}$

继续递推三个隐藏状态在 时刻3 时对应的各自两个局部状态，此时观测状态为 1：

$\begin{aligned} & \delta_3(1) = \underset{1 \le j \le 3}{\max}[\delta_1(j)a_{j1}]b_1(o_3) = \underset{1 \le j \le 3}{\max}[\underset{第一种情况}{\underline{\underset{上一次是盒子1}{0.028} \times \underset{盒子1\rightarrow盒子1}{0.5}}}, \underset{第二种情况}{\underline{\underset{上一次是盒子2}{0.0504} \times \underset{盒子2\rightarrow盒子1}{0.3}}}, \underset{第三种情况}{\underline{\underset{上一次是盒子3}{0.042} \times \underset{盒子3\rightarrow盒子1}{0.2}}}] \times \underset{红球}{0.5} = 0.00756\\ & \qquad \psi_3(1) = \underset{最大值对应的索引(从1开始)}{2}\\ & \delta_3(2) = \underset{1 \le j \le 3}{\max}[\delta_1(j)a_{j2}]b_2(o_3) = \underset{1 \le j \le 3}{\max}[\underset{第一种情况}{\underline{\underset{上一次是盒子1}{0.028} \times \underset{盒子1\rightarrow盒子2}{0.2}}}, \underset{第二种情况}{\underline{\underset{上一次是盒子2}{0.0504} \times \underset{盒子2\rightarrow盒子2}{0.5}}}, \underset{第三种情况}{\underline{\underset{上一次是盒子3}{0.042} \times \underset{盒子3\rightarrow盒子2}{0.3}}}] \times \underset{红球}{0.4} = 0.0504\\ & \qquad \psi_3(2) = \underset{最大值对应的索引(从1开始)}{2}\\ & \delta_3(3) = \underset{1 \le j \le 3}{\max}[\delta_1(j)a_{j3}]b_3(o_3) = \underset{1 \le j \le 3}{\max}[\underset{第一种情况}{\underline{\underset{上一次是盒子1}{0.028} \times \underset{盒子1\rightarrow盒子3}{0.3}}}, \underset{第二种情况}{\underline{\underset{上一次是盒子2}{0.0504} \times \underset{盒子2\rightarrow盒子3}{0.2}}}, \underset{第三种情况}{\underline{\underset{上一次是盒子3}{0.042} \times \underset{盒子3\rightarrow盒子3}{0.5}}}] \times \underset{红球}{0.7} = 0.042\\ & \qquad \psi_3(3) = \underset{最大值对应的索引(从1开始)}{3}\\ \end{aligned}$

维特比算法是一种常用的 HMM 解码算法，它基于动态规划来求解最优状态序列。维特比算法定义了两个局部状态 $\delta_t(q)$ 和 $\psi_t(q)$ 来进行递推。其中， $\delta_t(q)$ 表示在时刻 $t$ 隐藏状态为 $q$ 的所有可能的状态转移路径中的概率最大值； $\psi_t(q)$ 表示在时刻 $t$ 隐藏状态为 $q$ 的所有单个状态转移路径中概率最大的转移路径中第 $t - 1$ 个节点的隐藏状态。

在上述的例子中，最后一个时刻的最大概率为 $\delta_3(3)$ ，这意味着在时刻 3，隐藏状态为 3 的概率最大。因此，我们可以得到 $q^*_3 = 3$ ，即在时刻 3 最可能的隐藏状态为 3。

接下来，我们可以利用局部状态 $\psi_t(i)$ 来回溯得到最优状态序列。由于 $\psi_3(3)=3$ ，所以 $q^*_2 = 3$ ；由于 $\psi_2(3)=3$ ，所以 $q^*_1 = 3$ 。因此，我们得到了最终的最优状态序列为 ${3, 3, 3\}$ 。

维特比算法还是借鉴了动态规划的思想

小结：

输入：HMM 模型 $\lambda = (A, B, \prod)$ ，观测序列 $O = (o_1, o_2, ..., o_T)$
输出：最有可能的隐藏状态序列 $Q^* = q^*_1, q^*_1,..., q^*_T$

流程如下：

步骤一：初始化局部状态

$\begin{aligned} & \delta_1(q) = \Pi_i b_i (o_1) \quad i = 1, 2, ..., N\\ & \psi_1(q) = 0 \quad i = 1, 2, ..., N \end{aligned}$

步骤二：进行动态规划递推时刻 $t = 2, 3, ..., T$ 的局部状态

步骤三：计算时刻 $T$ 最大的 $\delta_T(i)$ ，即为最可能隐藏状态序列出现的概率。计算时刻 $T$ 最大的 $\psi_t(q)$ ，即为时刻 $T$ 最可能的隐藏状态。

$\begin{aligned} & P^* = \underset{1 \le j \le N}{\max} \delta_T(i)\\ & q^*_T = \underset{1 \le j \le N}{\text{argmax}}[\delta_T(q)] \end{aligned}$

步骤四：利用局部状态 $\psi_t(i)$ 开始回溯。对于 $t = T - 1, T - 2, ..., 1$ ：

$q^*_t = \psi_{t+1}(q^*_{t+1})$

最终得到最有可能的隐藏状态序列 $Q^* = q^*_1, q^*_2, ..., q^*_T$ 。

其中：

$A$ ：状态转移矩阵，其中 $a_{ij}$ 表示从隐藏状态 $i$ 转移到隐藏状态 $j$ 的概率。
$B$ ：观测概率矩阵，其中 $b_j(k)$ 表示在隐藏状态 $j$ 下观测到符号 $k$ 的概率。
$\Pi$ ：初始状态概率向量，其中 $\pi_i$ 表示初始时刻隐藏状态为 $i$ 的概率。
$O$ ：观测序列，其中 $o_t$ 表示时刻 $t$ 的观测值。
$\lambda$ ：HMM 模型参数，包括状态转移矩阵 $A$ 、观测概率矩阵 $B$ 和初始状态概率向量 $\Pi$ 。
$\delta_t(q)$ ：在时刻 $t$ 隐藏状态为 $q$ 的所有可能的状态转移路径中的概率最大值。
$\psi_t(q)$ ：在时刻 $t$ 隐藏状态为 $q$ 的所有单个状态转移路径中概率最大的转移路径中第 $t - 1$ 个节点的隐藏状态。

6. 鲍姆-韦尔奇算法简介

学习目标：

了解鲍姆-韦尔奇算法

6.1 问题引入

模型参数学习问题 ―― 鲍姆-韦尔奇（Baum-Welch）算法（状态未知），即给定观测序列 $O = \{o_1,o_2,..., o_T\}$ ，估计模型 $\lambda = (A, B, \Pi)$ 的参数，使该模型下观测序列的条件概率 $P (O ∣ A)$ 最大。

它的解法最常用的是鲍姆-韦尔奇算法，其实就是基于 EM 算法的求解，只不过鲍姆-韦尔奇算法出现的时代，EM 算法还没有被抽象出来，所以被叫为鲍姆-韦尔奇算法。

在这里插入图片描述

6.2 鲍姆-韦尔奇算法原理

鲍姆-韦尔奇算法原理既然使用的就是 EM 算法的原理，那么我们需要在 E 步求出联合分布 $\lambda)$ 基于条件概率 $P(I|O,\overline{\lambda})$ 的期望，其中 $\overline{\lambda}$ 为当前的模型参数；然后在 M 步最大化这个期望，得到更新的模型参数 $\lambda$ 。

首先来看看 E 步，当前模型参数为 $\overline{\lambda}$ ，联合分布 $P(O,I|\lambda)$ 基于条件概率P $\overline{\lambda})$ 的期望表达式为：

$L(\lambda, \overline{\lambda}) = \sum_I P(I|O, \overline{\lambda})\log P(O, I | \lambda)$

在 M 步，我们极大化上式，然后得到更新后的模型参数如下：

$\overline{\lambda} = \underset{\lambda}{\text{argmax}}\sum_IP(I|O, \overline{\lambda})\log{P(O, I|\lambda)}$

通过 E 步和 M 步的迭代，直到 $\overline{\lambda}$ 收敛。

7. HMM 模型 API 介绍

学习目标：

指导 HMM 模型 API 使用方法

7.1 API 的安装

官网链接：https://hmmlearn.readthedocs.io/en/latest/

pip install hmmlearn==0.2.5

7.2 hmmlearn介绍

hmmlearn 实现了三种 HMM 模型类，按照观测状态是连续状态还是离散状态，可以分为两类。

GaussianHMM 和 GMMHMM 是连续观测状态的 HMM 模型
MultinomialHMM 是离散观测状态的模型，也是我们在 HMM 原理系列篇里面使用的模型

GaussianHMM：高斯隐马尔可夫模型（Gaussian Hidden Markov Model）

GMMHMM：混合高斯隐马尔可夫模型（Gaussian Mixture Hidden Markov Model）

MultinomialHMM：多项式隐马尔可夫模型（Multinomial Hidden Markov Model）

在这里主要介绍我们前面一直讲的关于离散状态的 MultinomialHMM 模型。对于 MultinomialHMM 的模型，使用比较简单。

from hmmlearn import hmm


model = hmm.MultinomialHMM (n_components=1, startprob_prior=1.0,
                            algorithm='viterbi', random_state=None,
                            n_iter=10, tol=0.01, verbose=False,
                            params='ste', init_params='ste')

作用：hmm.MultinomialHMM() 是 hmmlearn 库中的一个类，它用于创建一个具有多项式（离散）发射的隐马尔可夫模型。
参数：
- n_components：（int）隐含状态个数
- n_iter：（int, optional ）训练时循环（迭代）最大次数
- tol：（float, optional ）收敛阈值。如果对数似然的增益低于此值，则 EM 将停止。
- verbose：（bool, optional )赋值为 True 时，会向标准输出输出每次迭代的概率（score）与本次
- init_params：（string, optional ）决定哪些参数会在训练时被初始化。
  - ‘s’表示 startprob：参数对应我们的隐藏状态初始分布 $\Pi$
  - ‘t’表示 transmat：对应我们的状态转移矩阵 $A$
  - ‘e’表示 emissionprob：对应我们的观测状态概率矩阵 $B$
  - 空字符串 “” 代表全部使用用户提供的参数进行训练
方法：
- fit()
- decode()
- score()
- 等

7.3 MultinomialHMM 实例

下面我们用我们在前面讲的关于球的那个例子使用 MultinomialHMM 跑一遍。

import numpy as np
from hmmlearn import hmm

# 设定隐藏状态的集合 
states = ["box 1", "box 2", "box 3"]
n_states = len(states)

# 设定观察状态的集合
observations = ["red", "white"]
n_observations = len(observations)

# 设定初始状态分布
start_probability = np.array([0.2, 0.4, 0.4])

# 设定状态转移概率分布矩阵
transition_probability = np.array([[0.5, 0.2, 0.3],
                                   [0.3, 0.5, 0.2],
                                   [0.2, 0.3, 0.5]])

# 设定观测状态概率矩阵
emission_probability = np.array([[0.5, 0.5],
                                 [0.4, 0.6],
                                 [0.7, 0.3]])

# 定义模型
model = hmm.MultinomialHMM(n_components=n_states)

# 设定模型参数
model.startprob_ = start_probability  # 初始化状态分布
model.transmat_ = transition_probability  # 初始化状态转移概率分布矩阵
model.emissionprob_ = emission_probability  # 初始化观测状态概率矩阵

现在我们来跑一跑 HMM 问题三：维特比算法的解码过程，使用和之前一样的观测序列来解码，代码如下：

seen = np.array([[0, 1, 0]]).T  # 设定观测序列（红白红）

# 维特比模型训练
box = model.predict(seen)

print("球的观测顺序为：", ' → '.join(map(lambda x: observations[x], seen.flatten())))
# 注意：需要使用flatten方法，把seen从二维变成一维
print("最可能的隐藏状态序列为：", ' → '.join(map(lambda x: states[x], box)))

使用 map 函数将 seen 中数组的元素对应 observations 中的元素
使用 map 函数将 box 中数组的元素对应 states 中的元素

球的观测顺序为： red → white → red
最可能的隐藏状态序列为： box 3 → box 2 → box 2

我们再来看看求 HMM 问题一的观测序列的概率的问题，代码如下：

prob = model.score(seen)

print(f"观测序列出现的概率为：{
      
      prob}")

观测序列出现的概率为：-2.038545309915233

要注意的是 score 函数返回的是以自然对数为底的对数概率值，我们在 HMM 问题一中手动计算的结果是未取对数的原始概率是 0.13022。对比一下：

import math

prob_true = math.exp(prob)
print(f"观测序列出现的概率为：{
      
      prob_true * 100:.3f}%")

观测序列出现的概率为：13.022%

[学习笔记] [机器学习] 12. [下] HMM 隐马尔可夫算法（马尔科夫链、HMM 三类问题、前后后向算法、维特比算法、鲍姆-韦尔奇算法、API 及实例）

5. 维特比算法解码隐藏状态序列 $Q$

5.1 HMM 最可能隐藏状态序列求解概述

5.2 维特比算法概述

5.3 维特比算法流程总结

5.4 HMM 维特比算法求解实例

6. 鲍姆-韦尔奇算法简介

6.1 问题引入

6.2 鲍姆-韦尔奇算法原理

7. HMM 模型 API 介绍

7.1 API 的安装

7.2 hmmlearn介绍

7.3 MultinomialHMM 实例

猜你喜欢

[学习笔记] [机器学习] 12. [下] HMM 隐马尔可夫算法（马尔科夫链、HMM 三类问题、前后后向算法、维特比算法、鲍姆-韦尔奇算法、API 及实例）

5. 维特比算法解码隐藏状态序列 Q Q Q

5.1 HMM 最可能隐藏状态序列求解概述

5.2 维特比算法概述

5.3 维特比算法流程总结

5.4 HMM 维特比算法求解实例

6. 鲍姆-韦尔奇算法简介

6.1 问题引入

6.2 鲍姆-韦尔奇算法原理

7. HMM 模型 API 介绍

7.1 API 的安装

7.2 hmmlearn介绍

7.3 MultinomialHMM 实例

猜你喜欢

5. 维特比算法解码隐藏状态序列 $Q$