神奇的费米问题

在很多数据分析面试中,面试官都喜欢问求职者这样的一些问题:

北京有多少量特斯拉汽车?
某胡同口的煎饼摊一年能卖出多少个煎饼?
一辆公交车里能装下多少个乒乓球?
一个正常成年人有多少根头发?

一般人遇到这样的问题就会感觉摸不着头脑,不知道怎么解决,干脆凭感觉瞎猜一个数字。这其实忽视了面试官考察的目的,他不是要你一个确定的数字,而是想考验你的数据思维能力,如何在数据不明确、以及各种限制条件下,利用一些假设的理由和经验推算出正确答案。
在这里插入图片描述
这种看似无厘头的问题,被称为费米问题,是以科学家费米命名的。

这类问题能把两类人清楚地区分出来。
一类是具有文科思维的人,擅长赞叹和模糊想象,它主要依靠的是人的第一反应和直觉,比如小孩天生就会看到的东西进行赞叹。
另一种就是具有理科思维的人,擅长通过逻辑推理、分析的能力解决具体问题。这种思维不是人天生的,需要经过长期的训练。
在这里插入图片描述
公司招聘人需要的是经过长期训练,具有严密逻辑推理、分析能力的人,所以费米问题可以考察出一个人有什么样的思维方式。

费米思想

费米是意大利裔的美国物理学家,曾在1938年获得诺贝尔物理学奖,而他被世人所更为熟知的,则是他在芝加哥大学课堂上凭空抛出的一个看似荒谬的问题:

“芝加哥有多少个钢琴调音师?”
在这里插入图片描述
听到这个问题的学生都是一脸茫然,费米则提示遇到这样看似庞大的问题,可以把这个问题分解成一些便于操作和认知的小问题,根据猜测和假设去估算问题。

这也就是费米思想的核心:逻辑拆解

也就是说把一个庞大的、抽象的、复杂的问题,逐级拆解为微小的、具体的、简单的问题,然后再将这些小问题进一步拆解,只要保证了逻辑关系,那么将这些可以回答的小问题答案,逐步反推到费米问题上,就可以得到最终的准确答案。

在麦肯锡分析思维中,这种方法叫做“逻辑树法”。

那么对于这样的问题,费米是怎么解答的呢?

钢琴调音师数量=全部钢琴调音师1年的总工作时间/ 一位调音师每年工作时间。
所以费米将这个问题拆解成了两个问题:每年芝加哥全部调音师的工作时长,以及一位调音师每年的工作时间。
在这里插入图片描述
“全部钢琴调音师1年的总工作时间”又可以拆解成3个子问题:

  • 芝加哥有多少架钢琴?
  • 每架钢琴多久调一次音?
  • 一位调音师的调音时长?
    在这里插入图片描述
    这样就将费米问题拆解成了基本问题,基本问题的确定就要涉及费米问题的另一个主要思想:问题估算。

费米估算

对于基本问题的估算方法,费米给出了一个天才式的估算方法:对于小问题的估算,不要估算其本身,而是先估算其上下界,然后在10倍的范围内估算出数值,这种方法竟然能保证极高的准确率。

费米是如何进行估算的呢?

第一个子问题:芝加哥有多少架钢琴?

首先需要知道芝加哥有多少人,其次需要知道拥有钢琴的人所占的一个比例。
芝加哥的人口上网可以查出来大概有250万,平均每个家庭有4个人(美国四人家庭居多),那么芝加哥估计会有75万个家庭。这些家庭中有多少有钢琴呢?在当时的美国,钢琴属于半稀缺物品,拥有钢琴的家庭应该不会超过1/2,也不会低于1/10,因此费米估算为1/3,那么全市大概会有25万架钢琴。

第二个子问题:钢琴每年要调几次音?

钢琴调音师属于稀缺行业,调音次数应该不会超过1年3次,也不会低于10年1次,因此费米估算为3年1次,也就是每年0.33次,那么每年全市有8.3万架钢琴需要调音。

第三个子问题:调一次得多久?

一般不会超过10小时,也不会低于1小时,因此费米估算为3小时。

这样第一个大问题我们就解决了,总钢琴的总调音时长大约是3*83000=249000H。

下面估算第二个大问题:一位调音师每年工作多长时间呢?

假设调音师一年工作250天,算上他每天需要往返的路时,那么他一年的工作时间就是250240.6=3600H。

这样所有的问题都已经估算出了结果,最终调音师数量=249000/3600=69位。

这个答案准不准呢?经过费米和学生们事后进行电话号码验证,大概芝加哥市有80位调音师,除去一些号码重复的,其结果竟然跟费米估算的相差无几!

暗中帮助的平均律

但是可能有人会产生质疑,如果将费米估算中家庭拥有钢琴率改为1/5,而不是1/3,其结果不就会改变了吗?费米的这些估算难道都是巧合吗?

其实,费米估算法中涉及到了一个数据概念:平均律。

它的原理是在任何一组计算中,估算带来的错误都可以相互抵消,所做的假设越多,被抵消的概率就会越大。

也就是说,有人会假设1/5的家庭拥有钢琴,他也可能同时会假设每架钢琴需要1年调1次音,而不是3年调一次,这样一高一低,错误估计就会被相互抵消。
换成数据分析的语言就是,你在假设或者猜测某一个小事件的时候,你的推测假设有可能有的过高,有可能有的过低,如果这些“点”的数量足够,最终误差就会被相互抵消,整体结果最终会呈现为一个平均值,这就是平均律理论。
在这里插入图片描述
其实就类似于上图,我们确定一个估算上边界,以及一个估算下边界,所有落在这个范围里面的点都会趋向于平均值,落在平均值上的点和平均值下的点就会相互抵消消除,其结果也就趋于一个准确值了。

猜你喜欢

转载自blog.csdn.net/kejiayuan0806/article/details/115406536