4星|《对赌:信息不足时如何做出高明决策》:赌徒概率思维最优

对赌:信息不足时如何做出高明决策

作者是认知心理学博士,有一个职业扑克玩家哥哥,机缘巧合专职玩德州扑克20年。

作者在玩牌过程中意识到,扑克比赛中的决策次数特别多特别频繁,差不多每两分钟要有一次决策,可能一个决策就影响到一套房子的输赢。于是对优秀扑克选手的决策模式做了许多思考。

书中总结了优秀扑克选手的决策思路,最重要的我认为是两点:
1:概率思维:认识到世界是不可知的,只能尽量选择赢牌概率最大的方案;
2:正确的决策不一定导致好的结果:正确的决策可能导致输牌,绝不能因此认为决策就是错误的;

作者引用了博弈论的基本理论,认为生活中只要有选择就是在博弈,在赌自己的选择是最优的,真实的生活更像扑克而不是象棋:自己接下来摸到什么牌对手摸到什么牌是未知的,运气的成分很大,很自然回用结果来判断决策的对错(但这是不对的),赌徒的概率思维在生活中是最优选择。

书中还给出跟概率思维相反的常见思维误区:动机性推理、自利性偏差、偏见盲点、确认性思维、时间贴现、事后偏见等。

作者也给出了让大脑逐步跳出思维误区适应概率思维的一些方法,比如参加求真小组,小组内讨论问题严格区分情绪、决策、结果,重点讨论决策过程是不是最优而不关注情绪和结果。

作者自己儿子考试成绩不好,总是习惯性地怪罪老师不好,作者用这个例子说明这种失败了怪别人的思维误区是人类天性,认识到这一点才能更好地帮助他人。

上面我说的概率思维,书中大部分时候叫做“对赌思维”,个别地方叫概率思维。书中频繁出现“对赌”这个词,根据上下文来看,基本确定就是英文“bet”也就是赌博。

总体评价4星,非常好。

以下是书中一些内容的摘抄:

1:一段时间后,这些世界一流的扑克玩家教会了我打牌的本质:面对不确定的未来做决策。将决策视为对赌的启示使我能够在不确定的情况下找到学习的机会。我发现,将决策视为对赌使我避免了常见的决策陷阱,让我以更理性的方式从结果中学习,并尽可能地在此过程中不受情绪的左右。P前言7

2:当我刚开始玩扑克时,有经验的玩家让我警惕以结果为导向的危险,告诫我不能仅仅因为眼前的几手牌没有打好就要去改变策略,要抵制这种诱惑。P4

3:现在我们花一点时间,先回想一下去年你做过的最佳决策是什么,再想一想最差决策是什么。我敢打赌,你的最佳决策带来了一个好结果,而最差决策导致了一个坏结果。P4

4:我们在日常生活中做出的决策,无论是关于商业、储蓄、消费、健康、生活方式、养育子女,还是人际关系的决策,都相当符合冯·诺依曼对“真正的博弈”的定义。它们涉及不确定性、风险和偶尔的欺诈,这些都是扑克游戏的主要元素。P19

5:这就是象棋,但现实生活并非如此。现实生活更像扑克,所有这些不确定因素都给了我们欺骗自己和曲解信息的空间。对于一些我们从未发现的错误,扑克给我们保留了余地。因为一旦赢了牌我们就不会再去追究自己的错误;在所有决策正确但仍然输牌时,扑克也允许我们将失败的结果当作决策失误的证明。P21

6:优秀的扑克玩家和英明的决策者之间的共同之处就是他们都接受这样一个事实:我们的世界是无常的和不可预知的。他们清楚,自己几乎不可能确切地知道某件事情将会如何发生。他们接受这种不确定性,并试图弄清这种不确定的程度,而不是专注于如何才能确定。P27

7:有很多原因可以解释为什么接受不确定性并给它一个热烈的拥抱会帮助我们成为更好的决策者。这里提供两个例子。首先,“我不确定”仅仅代表一种对世界更准确的描述;其次,当我们接受了自己对某事物无法确定的时候,就不容易陷入黑白思维的陷阱。P28

8:无论何时我们做出育儿选择(关于纪律、营养、学校、育儿理念,居住地的选择等)都是在“博弈”。我们认为这些选择将实现我们为孩子设计的未来,并且它们要优于我们可能会做出的任何其他选择。因为有限资源的限制,我们必须分配我们的时间、金钱和注意力。P46

9:在做大部分决策时,我们并不是在与另一个人对赌。确切地说,我们是在与所有我们放弃选择的各种预期版本的自我进行对赌。P46

10:如何才能确定我们做出了最正确的决策呢?如果另一种选择会给我们带来更多的快乐、满足或金钱呢?很可惜,答案是:我们无法确定。因为有一些我们无法左右的事物(运气)在影响着结果。我们想象的结果仅仅是一些尚未发生的可能性。47

11:令人惊讶的是,一个人越聪明他的盲点偏见就越大。研究人员通过对受试者进行了七种认知偏差测试后发现,认知能力对偏见盲点没有丝毫的减弱作用。而且,那些意识到自己偏见的人并不能更好地克服它们。事实上,在这七项测试中的六项结果显示,“认知能力更好的参与者表现出了更大的偏见盲点”。P65

12:获得经验和成为专家之间有着很大的差异。这种差异在于能否识别决策结果何时会带来学习机会,以及学习内容是什么。P81

13:如果生活更像象棋而不是扑克,那也许我们就能以更理想的方式进行学习。由于不确定性的减少,结果质量和决策质量之间的联系会更加清晰。P83

14:我们应对结果的方式有着可预见的模式:把好的结果归功于自己,把坏结果归咎于运气,所以我们自己并没有错。这样做的结果是我们无法从经验中进行有效的学习。“自利性偏差”(self-serving bias)是这种区分结果模式的术语。P92

15:不幸的是,通过观察他人来学习也同样充满了偏见。就像我们会模式化地对自己的决策结果进行区分一样,对于同行们的决策结果我们也早就事先确定了区分的方式。与对待自己的决策结果一样,我们也采用了同样的非黑即白思维来区分他人的结果,不同的是我们反转了剧情。P101

16:但是艾维不是这种人。对他来说,从错误中学习的机会比利用晚餐来庆祝自己的胜利重要得多。他刚刚在一场漫长的世界级扑克竞赛中赢得冠军以及50万美元的奖金,但他只想和另一名职业玩家讨论如何才能做出更好的决策。P111

17:《习惯的力量》(The Power of Habit)一书中提供了一种改变习惯的黄金法则——应对习惯的最佳方式是尊重习惯回路:“想改变一种习惯,你必须保持原有的提示,兑现原有的奖励,但要添加新的常规。” P112

18:动机性推理和自利性偏差是深深扎根于我们大脑运作方式的两种思维习惯。我们在确认性思维的形成上投入巨大,而且总是在毫无知觉的情况下就陷入这些偏见的陷阱中。确认性思维很难被发现也很难被改变,而且当我们试图改变它时会发现,它也很难实现自我强化。通过对赌思维来奖励自己是一种办法, P139

19:我亲身体验了团体认同重塑个人思维习惯的力量。我的进步和提高得益于以下几个方面的努力尝试:成为最好的不吝啬于肯定他人的人,成为最勇于承认错误的人,以及成为最善于在好结果中发现错误的人。P139

20:在我的职业生涯早期,我的扑克小组告诉我输牌时避免受到自利性偏差影响的方法是预先设定一个“损失限额”——他们建议当我在牌局中输掉600美元时就离开牌桌。给我建议的那些聪明的、经验丰富的玩家知道,在输牌时人往往会变得不够理性,因此在分析自己输牌原因(运气糟糕还是发挥失常)的时候很容易会出现差错。P143

21:首先,异端学会的研究表明,人们会自然而然地倾向于同质性和确认性思维。我们都有被与我们想法接近的人吸引的经历。完全为追求真理而培养的科学家们也不能对此免疫。P154

22:根据该论文,CUDOS的含义如下:C(Communism):共有性(数据属于团体)。U(Universalism):普遍性(主张和证据无论出处均适用统一标准)。D(Disinterestedness):无私利性(对影响团体评估的潜在冲突保持警惕)。O(Organized)S(Skepticism):有条理的怀疑性(团体讨论鼓励参与和异议)。如果你想选择一个制定团队参与规则的参考范例,默顿提出的规范无疑是最好的。P160

23:另一种将信息与信使分离的方式是,想象信息出自我们重视程度不同的来源。当我们喜欢的某个人告诉我们某个信息时,试想一下我们讨厌的某个人告诉我们同样的信息,反之亦然。P170

24:在使用我打过的牌局作为例证时,我只会讲到决策环节,不会更进一步透露牌局结果。我的扑克团体就是这样训练我的。P174

25:我通常都会发现,在切换立场进行辩论或娴熟地为异议进行辩护之后,在某个问题上观点相距甚远的两个人都会逐渐向中间靠拢。P176

26:我们应该鼓励怀疑主义并在可能的情况下将其付诸实践。“魔鬼拥护者”(devil's advocate)一词是从几个世纪以前天主教会在封圣程序中聘请人来对圣徒地位提出反对意见的实践中发展而来的。就像美国中央情报局有红色突击队以及国务院有异议渠道一样,我们可以将异议纳入我们的职业和个人生活中。P178

27:我的儿子非常善于把糟糕的考试成绩归咎于老师。我必须小心谨慎地以避免重复莱特曼的错误。我会对他说:“有这样的老师一定让你感到很难过吧。你认为应该怎么做才能改善今后的成绩呢?”这种方式立即确认了孩子的看法,而且引发了有效的话题讨论,P183

28:这种我们都不得不以牺牲未来自我为代价来满足当前自我的倾向被称为时间贴现(temporal discounting).我们宁愿非理性地得到大打折扣的立即奖励也不愿意等待一段时间来获得更大的延时奖励。一个成人时间贴现的例子来自20世纪90年代关于军事缩编的一项研究,该缩编导致成千上万的军人以极低的折扣率选择一次性付清退休金而不是有保障的年金支付。P190

29:商业记者和作家苏茜·韦尔奇(Suzy Welch)开发了一款名为10-10-10的流行工具,它具有将未来的我们带入自己当前决策的效果。“每一个10-10-10的过程都会以一个问题开始·.....”“我的每一次选择在10分钟/10个月/10年内分别得到了什么结果?”这一系列问题触发了提示责任性对话。P196

30:这样一来,水手们可以安全地行船而免于受到歌声的影响,同时奥德修斯也可以在不危及船只的情况下欣赏塞壬的歌声。这个计划完美无缺。这种行为——利用过去的我们阻止现在的我们做出蠢事——被称为尤利西斯合约(Ulysses contract)。P210

31:投资顾问会采用这种方式与客户讨论他们的目标。他们会提前与客户确认在何种情况下应该针对特定股票进行买入、卖出、持有或压低头寸。如果客户稍后想要做出情绪化的决定(如涉及投资价值的突然上升或下降),顾问就可以提醒客户之前进行的讨论和达成的一致意见。P212

32:那些在追求目标过程中想象障碍的人更有可能取得成功。这种策略被她称为“心理对照”(mental contrasting)。她的第一项研究涉及了参加减肥计划的女性,结果显示,那些对减肥有着强烈的积极设想的受试者比那些持有负面想象的受试者少减掉24磅(约11千克)。P233

33:事后看来,当时的2%~3%变成了100%,所有其他树枝,无论多么粗壮,也都会被忽略掉。这就是事后偏见,概率思维的死敌。P238

猜你喜欢

转载自www.cnblogs.com/zuoqs/p/10173125.html