建模方法（一）-博弈论中使用划线法求解纳什均衡

对网上的博弈论划线法的总结如下。

完全信息静态博弈是指博弈各方同时决策，任何博弈参与者对博弈信息均完全了解。博弈信息包括：博弈过程、博弈结果、博弈各方的策略集、收益等。它的均衡可以用纳什均衡，且每个完全信息静态博弈都存在这样的均衡。纳什均衡可以用划线法+支付矩阵来求得，但并不是所有的求解纳什均衡都可以用这个方法。

参与者位于支付矩阵的上部和左部，参与者的策略位于矩阵左部和上部，矩阵中的数值为组合策略对于参与者的利益值。

这里拿剪刀石头布博弈来说，支付矩阵如下图所示：

其中第一行第一列（0，0）表示参与者都选择锤头的策略对于两个参与者的利益都是0。

划线原理：假设除了最后一个参与者其他参与者都选定某个策略，最后一个参与者选择对他来说利益最大的策略，相应最大值下面划横线。划线方法：按列比较各行第一个分量; 按行比较各列的第二的分量; 分别在最大值下划线; 其实就是找双方赢得都最大的偶对

所以以第一行为例，对于第一行所有数据的第二个分量的最大值为1，在1下面画横线。对于两个分量都画了横线的数据就是双赢的情况，显然图中没有这样的数据，说明有些博弈通过划线法不能找出纳什均衡，这就是两个参与者划线方法。

那如果是3个参与者呢，如下图所示问题：

以博弈方3来划分为3个支付矩阵，上图是博弈方3在选择A的时候对应的支付矩阵。第一个和第二个分量的划线方法和之前的两个参与者划线方法一样，对每一列只看第一个分量，每一行只看第二个分量，找最大值划线。因为划线的实质就是假设某个参与者选择了某个策略，对于另一个参与者选择当前情况收益最大的策略。类似的原理，对于第三个分量划线的方法是：三个支付矩阵的同一格进行比较第三个分量，在最大值下面划线，这等价于在参与者1和参与者2都选定策略的情况下，对不同策略对应的利益值中选择最大值。

建模方法（一）-博弈论中使用划线法求解纳什均衡

猜你喜欢