星座真的可以判定你的性格吗 测试你的第二星座( 二 )


星座真的可以判定你的性格吗 测试你的第二星座


但结论未必如此 。因果是一个非常强的逻辑,我们初中学过因果叫充分条件,而不是必要条件 。也就是说,因果意味着我们如果做了 A,那么一定会导致 B 的发生 。这在数据的领域里面其实是非常难证明的,我们可以通过数据实验去证明 B 发生和 A 没有关系,但是很难证明 A 就是 B 的发生的充分条件也就是原因,因为有可能他们之间只是数据相关关系,而不是因果关系 。
是不是感觉有点晕?没关系,现在我用一个你非常熟悉的例子,再给你解释一下 。我们经常能看到吸烟会致癌这个理论 。但是吸烟真的能致癌吗?
当然,我不是要替吸烟的人辩护,从健康程度来讲,吸烟的确是有害于健康的 。但是从科学角度上来讲,尽管医学家、统计学家在过去的几十年里做了非常多的试验,但到目前为止,我们还没有确凿的统计学证据可以说明吸烟致癌 。因为致癌的因素太多了,你无法判断吸烟能够直接导致癌症 。
现代统计学的奠基人费舍尔对香烟会导致肺癌结论表示了强烈的质疑,他只确认了吸烟和患有肺癌之间有相关性,但是从科学的角度上来讲,的确不能说因为吸烟,所以会导致肺癌 。
看上去数据是正确的,但是如何解释数据其实非常需要动脑子 。两件事情虽然相关,但是往往无法说明它们之间有因果关系 。因为我们的大脑容易记住有逻辑性的东西,所以我们经常把相关的东西“套上”一个因果的外壳,但这其实是不对的 。
因果关系需要大量实验的验证证明,只要有 A,B 一定会发生(且没有其他因素的干扰)才能说明 A 可以导致 B 的发生 。而这在现实里其实是非常难做到的,就像前面提到的吸烟会导致肺癌,如果要严格意义证明这一点,我们必须要找到若干组同卵双胞胎(确保他们的基因类似),饮食结构完全一样,活动也完全一样 。然后让他们一组人吸烟,另外一组不吸烟,还要让他们相互不知道在测试(确保对照试验公正性),最后还得吸烟组得了肺癌才有可能通过数据证明吸烟真的会导致肺癌 。
这个困难度可想而知 。所以以后在工作和生活中,不要轻易下因果关系的结论,相关并非因果 。
遗漏 X 变量——找到背后真实原因
我们在做数据探查之后发现了几个数据之间的相关性,虽然我们无法确认它们是因果关系,但真正在数据的探查和分析过程中,我们很有可能会找到相关的真实原因,从而去解决问题 。这里我把它叫做找到遗漏的 X 变量 。
举一个很有意思的例子,在英国瓦努阿图岛上的居民有一个奇怪的信仰:他们相信虱子有益于身体健康 。因为经过数百年的观察,这里的人发现身体健康的人身上通常都有虱子,而生病的人就没有 。
数据本身是准确无误的,科学家们也发现同样的数据,但不代表着岛上居民这个“虱子让人健康”的信仰就正确 。后来经过自然学家实地考察发现了真相,原来这里几乎所有人的身上都有虱子,但是如果有人发烧,随着体温升高,虱子会因为受不了高体温而离开 。
所以看上去是虱子使人健康,其实是体温高导致虱子不栖息在人身上 。所以,岛上居民的结论应该是看到没有虱子的人应该让他去就医,因为他发生了疾病 。在原始部落并没有体温计,这个结论的确可以帮助到他们,而不是盲目的相信“虱子让人健康” 。
再给你举个例子,现在都非常讲究母乳喂养,但究竟母乳喂养应该多久呢?世界卫生组织在《婴幼儿喂养指南》中建议母乳喂养两年或更长的时间 。相关研究也表明,与非母乳喂养的婴幼儿相比,母乳喂养的婴幼儿患某些传染病的风险更低,也有更低的死亡率 。

推荐阅读