“我和你妈掉水里,你先救谁?”这个问题终于有答案了

李万中 开智学堂

作者:李万中 来源:公众号「心理学与阅读」

01

张女士想要知道自己的丈夫是更重视自己,还是更重视他的妈妈。她问丈夫:“老公,我和你妈同时掉水里,你先救谁?”丈夫毫不迟疑地回答说:“当然是先救你啦。”听到丈夫的回答,张女士满意地笑了……

战斗机制造厂的李厂长想要知道飞机的哪个部位更需要加装厚装甲。他去停机坪调查从战场上返回的飞机,发现这些飞机的机翼部位有较多弹孔,而机舱和发动机部位则很少有弹孔。于是他决定给机翼加装厚装甲……

图片

张女士和李厂长这两个案例,似乎风马牛不相及,但两者实际上有个关键的相似之处。你觉得是什么呢?

张女士和李厂长在获取信息时,犯了同样的错误:没有选择科学的调查方法,而是用了糟糕的调查方法。

李厂长的错误更明显,他的思路是这样的:

  1. 停机坪里的飞机,机翼上的弹孔比发动机和机舱部位的弹孔要多很多。

因此,2. 飞机的机翼比发动机和机舱更容易中弹。

  1. 应该给飞机上更容易中弹的部位安装厚装甲。

因此,4. 应该给飞机的机翼安装厚装甲。

你认为以上思路有什么问题?

最致命的错误在于,在 1 和 2 之间,还有一个隐藏且不可信的 1.5 :

  1. 停机坪里的飞机,机翼上的弹孔比发动机和机舱部位的弹孔要多很多。

1.5 停机坪里的飞机是所有飞机的典型样本。

因此,2. 飞机的机翼比发动机和机舱更容易中弹。

要想得出 2 这个结论,1 和 1.5 都是必不可少的。虽然 1 是得到验证的可信前提,但 1.5 这个前提却很不可信。

停机坪里的飞机并不能代表所有飞机,只能代表那些能从战场上幸存下来的飞机。还有很多飞机已经坠毁在战场上。那些坠毁的飞机,很可能是由于发动机或机舱中弹而坠毁的。

这就是所谓的“幸存者偏差”:能幸存下来并被看到的样本,并不是能代表总体的好样本。

张女士的思路和李厂长类似,你觉得该如何用带序号的论 证表述张女士的思考过程?

02

可以这样表述:

丈夫在我问他“我和你妈同时掉水里,你先救谁?”这个问题时,告诉我他会先救我。

  1. 丈夫在我问他“我和你妈同时掉水里,你先救谁?”这个问题时,告诉我他会先救我。

因此,2. 丈夫会先救我,而不是他妈。

  1. 如果丈夫会先救我,而不是他妈,那就意味着丈夫更重视我,而不是他妈。

因此,4. 比起他妈,丈夫更重视我。

你觉得上述思路的错误出在哪里?

错误也是在 1 和 2 之间,还有一个隐藏且不可信的 1.5 :

  1. 丈夫在我问他“我和你妈同时掉水里,你先救谁?”这个问题时,他告诉我,他会先救我。

1.5. 丈夫此时口头报告的想法是他脑中所有想法的典型样本。或者说,丈夫此时的回答能代表他内心中长期稳定的真实态度。

因此,2. 丈夫会先救我,而不是他妈。

一方面,人们可能会故意说谎。丈夫可能想要讨好妻子,便在明知自己会先救母亲的情况下,故意说假话,让妻子误以为自己会先救妻子。

另一方面,人们也可能会说出自己也不确定是真是假的话。丈夫也许并不知道,当自己真的到了那个危急关头时,到底会先救母亲还是妻子。

但是,丈夫却没有回答“不知道”或“不确定”,而是回答了“先救妻子”。此时,丈夫也许算不上说谎,但也不能算是说了真话。

和李厂长一样,张女士选用了糟糕的调查方法。如果张女士想要改正自己的错误,选用更科学、更靠谱的调查方法,她应该怎么做呢?

张女士可以委托丈夫的一个朋友来替自己提这个问题。假设这个朋友就是李厂长。李厂长问张女士的丈夫:“你妈和你老婆同时掉水里,你先救谁?”如果丈夫不知道李厂长是妻子派来刺探自己的,他就更可能说出自己内心真实的想法。

图片

同理,李厂长也需要用更科学的取样方法,来避免幸存者偏差。我们要选取的样本,必须是能代表总体的好样本。理论上,我们要用随机取样的方法,使得总体中的每一个个体都有相同的可能性被选为样本。

03

你觉得,我们要怎么做才能尽可能实现随机抽样呢?有哪些常见的错误会导致我们的抽样过程不够随机呢?

以下是常见的取样错误:

1. 样本量太小

假设总体数量特别多,而选取的样本的数量又特别少,那很可能样本不够有代表性。比如,假设你想要调查全体中国人的性取向,然后你选取了上海市某大学某班级的 50 名学生。仅仅根据这 50 个个体,你试图推理出十几亿人的性取向分布,那很可能是不靠谱的。

2. 幸存者偏差

只选择自己能看到的、比较轻松就能调查到的样本。这种做法又叫“身边统计学”。因为“我身边的人、事、物”往往不是“所有人、事、物”的典型样本。比如,我发现自己身边的人大多很喜欢读书,于是我就可能误以为大多数地球人都喜欢读书。

3. 不均匀偏差

在一个样本分布不均匀的地方采集样本。比如,你想要知道大龄未婚青年的比例,结果你上相亲网站去调查。实际上,相亲网站的注册用户并不是总体的典型样本。

4. 主动性偏差

让样本自己主动成为样本,而样本自己成为样本的动机是不同的。比如,你设计了一份网络调查问卷,用来调查人们对于食用狗肉的态度。结果,你发现 87% 的被调查者都强烈反对食用狗肉。但 87% 这个数字不能代表总体。因为很可能是那些强烈反对食用狗肉的人,更愿意来填写这份问卷。■

注:本文内容摘编自《思想实验:升级认知的50个心智实验》,机械工业出版社出版。