地图Map-Matching流行算法及应用

http://www.semocean.com/lbs%E5%9C%B0%E5%9B%BEmap-matching%E6%B5%81%E8%A1%8C%E7%AE%97%E6%B3%95%E5%8F%8A%E5%BA%94%E7%94%A8/

从隐式马尔科夫模型到地图匹配（上）

https://mp.weixin.qq.com/s?__biz=MzI4MDAwMDY0OQ==&mid=2455399361&idx=1&sn=ed63070e65116e8addf939a4aed2d36c&chksm=fc11ea27cb6663310e524517e9aaecc97f99b099a4ebc7b56a18e0901b23fbcafc63ce3d5f29&scene=21#wechat_redirect

从隐式马尔科夫模型到地图匹配（下）

https://mp.weixin.qq.com/s/VY24VumqJI8N7yg62HAnvQ

假设我有三种类型的骰子：

正四面体的骰子，我们将其简称为 D4，可以随机投出 1,2,3,4 中的任意一个数字。
正六面体的骰子，也就是立方体的骰子，我们将其简称为 D6，可以随机投出 1,2,3,4,5,6 中的任意一个数字。
正八面体的骰子，我们将其简称为 D8，可以随机投出 1,2,3,4,5,6,7,8 中的任意一个数字。

由于骰子是均匀的，所以我们认为每次投出来每个数字的概率都是相等的。也就是说，D4 投出 1 到 4 中的每个数字的概率都是 1/4。D6 投出 1 到 6 中的每个数字的概率都是 1/6。D8 投出 1 到 8 中的每个数字的概率都是 1/8。

现在，我们要以一定的规则来投掷出一串数字，具体的规则如下：

刚开始的时候，我随机选择任意一个骰子来投掷出一个数字，也就是说，每个骰子被选中的概率都是 1/3。
以后的每一次投掷，我都以 1/2 的概率选择沿用上一次选择的骰子，或者分别以 1/4 的概率选择另外两个骰子。

那么，对应于这么一个场景，我们可以提出下面这三类问题：

已知我每次选用的骰子是哪一个，比如这个序列是 “D4-D6-D6-D8”，并且已知我投掷出的数字序列，比如是 “2-6-4-6”，那么我想知道，我投掷出这个序列的概率是多少？
已知我最终记录下来的数字序列，比如是 “2-6-4-6”，我想知道，投出这个序列的最大可能的骰子序列是哪一组？
问题可以更夸张一些，我不知道骰子是不是均匀的（意思就是，我不知道骰子投出每个数字的概率是多少），也不知道我每次投掷都是以什么样的概率去选择骰子的，但是我有很多组记录下来的数字序列，我想根据这些数字序列来反推出我所有不知道的概率值是多少？

上面的三个问题代表了隐式马尔科夫模型能解决的三大问题，每一类问题都有对应的算法。

为了规范后面的描述，我们先做一下术语定义：

上面提到的骰子序列，我们称之为隐藏序列；
上面提到的数字序列，我们称之为观测序列；
上面提到的骰子的投掷概率，我们称之为观测概率；
上面提到的骰子的选择概率，我们称之为转换概率；
观测概率和转换概率我们将其称之为模型参数。

那么，上面提到的三类问题，可以抽象为：

已知隐藏序列和模型参数，求观测序列的概率。
已知观测序列和模型参数，求最大可能的隐藏序列。
已知大量的观测序列，确定模型参数。

现在，我们来确定下我们的地图匹配属于哪一类问题。很容易就能想到，我们的 GPS 轨迹就是我们实际的观测结果，而实际走过的路段，则类似于骰子一样，我选择了这条路段，然后我在这个路段上的 GPS 定位又有一定概率的观测误差。所以，轨迹就对应于我们说的观测序列，而要求解的实际走过的路段序列则对应于我们说的隐藏序列，我们要通过观测序列来求解隐藏序列，这就对应于我们上面说的第二类问题。而这一类问题的最常用求解方法就是维特比算法（Viterbi Algorithm）。