神奇的费米问题

在很多数据分析面试中，面试官都喜欢问求职者这样的一些问题：

北京有多少量特斯拉汽车？
某胡同口的煎饼摊一年能卖出多少个煎饼？
一辆公交车里能装下多少个乒乓球？
一个正常成年人有多少根头发？

一般人遇到这样的问题就会感觉摸不着头脑，不知道怎么解决，干脆凭感觉瞎猜一个数字。这其实忽视了面试官考察的目的，他不是要你一个确定的数字，而是想考验你的数据思维能力，如何在数据不明确、以及各种限制条件下，利用一些假设的理由和经验推算出正确答案。
在这里插入图片描述
这种看似无厘头的问题，被称为费米问题，是以科学家费米命名的。

这类问题能把两类人清楚地区分出来。
一类是具有文科思维的人，擅长赞叹和模糊想象，它主要依靠的是人的第一反应和直觉，比如小孩天生就会看到的东西进行赞叹。
另一种就是具有理科思维的人，擅长通过逻辑推理、分析的能力解决具体问题。这种思维不是人天生的，需要经过长期的训练。
在这里插入图片描述
公司招聘人需要的是经过长期训练，具有严密逻辑推理、分析能力的人，所以费米问题可以考察出一个人有什么样的思维方式。

费米思想

费米是意大利裔的美国物理学家，曾在1938年获得诺贝尔物理学奖，而他被世人所更为熟知的，则是他在芝加哥大学课堂上凭空抛出的一个看似荒谬的问题：

“芝加哥有多少个钢琴调音师？”
在这里插入图片描述
听到这个问题的学生都是一脸茫然，费米则提示遇到这样看似庞大的问题，可以把这个问题分解成一些便于操作和认知的小问题，根据猜测和假设去估算问题。

这也就是费米思想的核心：逻辑拆解。

也就是说把一个庞大的、抽象的、复杂的问题，逐级拆解为微小的、具体的、简单的问题，然后再将这些小问题进一步拆解，只要保证了逻辑关系，那么将这些可以回答的小问题答案，逐步反推到费米问题上，就可以得到最终的准确答案。

在麦肯锡分析思维中，这种方法叫做“逻辑树法”。

那么对于这样的问题，费米是怎么解答的呢？

钢琴调音师数量=全部钢琴调音师1年的总工作时间/ 一位调音师每年工作时间。
所以费米将这个问题拆解成了两个问题：每年芝加哥全部调音师的工作时长，以及一位调音师每年的工作时间。
在这里插入图片描述
“全部钢琴调音师1年的总工作时间”又可以拆解成3个子问题：

芝加哥有多少架钢琴？
每架钢琴多久调一次音？
一位调音师的调音时长？

这样就将费米问题拆解成了基本问题，基本问题的确定就要涉及费米问题的另一个主要思想：问题估算。

费米估算

对于基本问题的估算方法，费米给出了一个天才式的估算方法：对于小问题的估算，不要估算其本身，而是先估算其上下界，然后在10倍的范围内估算出数值，这种方法竟然能保证极高的准确率。

费米是如何进行估算的呢？

第一个子问题：芝加哥有多少架钢琴？

首先需要知道芝加哥有多少人，其次需要知道拥有钢琴的人所占的一个比例。
芝加哥的人口上网可以查出来大概有250万，平均每个家庭有4个人（美国四人家庭居多），那么芝加哥估计会有75万个家庭。这些家庭中有多少有钢琴呢？在当时的美国，钢琴属于半稀缺物品，拥有钢琴的家庭应该不会超过1/2，也不会低于1/10，因此费米估算为1/3，那么全市大概会有25万架钢琴。

第二个子问题：钢琴每年要调几次音？

钢琴调音师属于稀缺行业，调音次数应该不会超过1年3次，也不会低于10年1次，因此费米估算为3年1次，也就是每年0.33次，那么每年全市有8.3万架钢琴需要调音。

第三个子问题：调一次得多久？

一般不会超过10小时，也不会低于1小时，因此费米估算为3小时。

这样第一个大问题我们就解决了，总钢琴的总调音时长大约是3*83000=249000H。

下面估算第二个大问题：一位调音师每年工作多长时间呢？

假设调音师一年工作250天，算上他每天需要往返的路时，那么他一年的工作时间就是250240.6=3600H。

这样所有的问题都已经估算出了结果，最终调音师数量=249000/3600=69位。

这个答案准不准呢？经过费米和学生们事后进行电话号码验证，大概芝加哥市有80位调音师，除去一些号码重复的，其结果竟然跟费米估算的相差无几！

暗中帮助的平均律

但是可能有人会产生质疑，如果将费米估算中家庭拥有钢琴率改为1/5，而不是1/3，其结果不就会改变了吗？费米的这些估算难道都是巧合吗？

其实，费米估算法中涉及到了一个数据概念：平均律。

它的原理是在任何一组计算中，估算带来的错误都可以相互抵消，所做的假设越多，被抵消的概率就会越大。

也就是说，有人会假设1/5的家庭拥有钢琴，他也可能同时会假设每架钢琴需要1年调1次音，而不是3年调一次，这样一高一低，错误估计就会被相互抵消。
换成数据分析的语言就是，你在假设或者猜测某一个小事件的时候，你的推测假设有可能有的过高，有可能有的过低，如果这些“点”的数量足够，最终误差就会被相互抵消，整体结果最终会呈现为一个平均值，这就是平均律理论。
在这里插入图片描述
其实就类似于上图，我们确定一个估算上边界，以及一个估算下边界，所有落在这个范围里面的点都会趋向于平均值，落在平均值上的点和平均值下的点就会相互抵消消除，其结果也就趋于一个准确值了。

费米思想

费米估算

暗中帮助的平均律

猜你喜欢