囚徒困境、怕拖累最优与纳什均衡

囚徒困境、怕拖累最优与纳什均衡:
1.囚徒困境:
1.1囚徒困境例子:
两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都保持沉默,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确凿,二者都判刑八年。
1.2 囚徒心理:
假如我是其中一个囚徒,会这样思考:如果同伙选择沉默,自己也沉默的话会被判1年,自己揭发对方的话会无罪释放,此时选择揭发更有利;如果同伙选择揭发自己,自己沉默的话会被判10年,自己也揭发对方的话会被判8年,此时选择揭发更有利。所以无论对方选择什么,我只要选择揭发对方一定是对于自己的利益最大化。
2.怕拖累最优:
可以看到,两个囚徒都只考虑自己的利益最大化时,反而并不是最好的,最好的结果就是两人都保持沉默而背叛一年,我们把这种情况叫做怕拖累最优。
3.纳什均衡:
纳什均衡本身就是利己主义者的最优策略,在囚徒困境中,我们的纳什均衡就是选择揭发对方。那是均衡并不是追求整体的最优解,而是个人的最优解,对个人而言,是一种稳定的均衡。
纳什均衡是一种非合作博弈状态,而这种非合作博弈状态也是目前在博弈论中应用最广的理论,是博弈论中最基本的概念之一。

发布了57 篇原创文章 · 获赞 8 · 访问量 3248

猜你喜欢

转载自blog.csdn.net/qq_41967539/article/details/103059427