然而,在一些研究中研究人员发现,对接受母乳喂养时间更长的婴幼儿来说,营养不良的风险更高 。这是对的么?应该缩短母乳喂养的时间么?1997 年,来自美国约翰斯·霍普金斯大学的研究人员专门就此进行了分析,发现真实原因是收入比较低的家庭通常其他食物非常有限,更倾向于接受更长时间的单一母乳喂养 。
所以没有充足的辅食才会导致婴儿营养不良,现在新生儿家庭都已经知道除了母乳喂养,在后期要增加辅食才可以让孩子更健康 。
所以,当我们在日常生活和工作当中看到两个数据强相关的时候,即使不能把它们当成因果关系,也可以顺藤摸瓜找到可能的原因,再用业务逻辑或者实验去验证这个可能的原因是否为真实原因 。缺乏业务逻辑的数据,永远只会是数据 。缺乏数据的业务逻辑,也永远只是在纸上的一个业务逻辑图而已 。
即使我们在找对了两件事情前后的因果关系,我们也会因为整体的选择对象、覆盖范围以及时间长度导致出现因果关系的推断错误 。下面我再分别给你讲解一下这三种误区 。
以偏概全——伯克松悖论
第一个就是统计数据本身因果逻辑成立,但是以偏概全 。统计学里对这个现象有一个特别著名的理论叫做“伯克松悖论” 。
伯克松悖论指的是当不同个体被纳入研究样本的机会不同时,研究样本中的两个变量 X 和 Y 表现出统计相关,而总体中 X 和 Y 却不存在这种相关性 。听上去是不是有点拗口?没关系,我举两个具体的例子来帮助你理解 。
第一个例子是著名的“海军与平民死亡率”的例子 。在 1898 年“美西战争” 期间,美国海军的死亡率是 9%,而同期纽约市市民的死亡率为 16% 。后来海军征兵部门就拿这个数据跟大家讲,待在部队里其实比大家待在家中更加安全 。
这逻辑肯定是错误的,但是错误不在具体数据,而是这两组数据其实没有什么可比性 。因为海军主要是年轻人,他们身强体壮、不会出现太多身体疾病;而纽约市民里面包含了新出生的婴儿、老年人、病人等等,这些人无论放在哪里,他的死亡率都会高于普通人 。
所以,参军不能说比大家待在家中更加安全,但反过来你也无法证明待在家中就比参军更安全,因为比对的对象不是在同一个人群里,这就是伯克森悖论 。
同样,现在的城市女孩会觉得,对他很热情的男生往往都长得不帅,长得很帅的男生往往对她都不够热情 。但其实帅和不帅并不是导致男孩热不热情的原因,只是因为只有长得帅或者对女生够热情的男生,才有更多机会和女孩子接触,你看下图就明白了,还是从局部看整体的逻辑不对 。
在我们工作当中也会遇到这样的情况 。我们经常会通过一些调查问卷去访谈一些使用者,看看营销效果如何 。
比如,现在我们有一个用户访谈的数据结果:购买某品牌产品的 100 人中,有 72% 的人说在一个月内看过该品牌的广告 ;而在未购买商品的 300 人中,有 76% 的人说一个月内没看到过这个品牌的广告 。
通过这个数据我们能看到什么呢?我们可以下结论说是广告提高了我们的用户转化率吗?这是不可以的,因为实际购买的人会对广告更有印象,而没有购买的人也许也看了广告,只不过他没有印象而已 。因为统计范围不同,所以不能够根据这个数据给出转化率比较高的结论,然后大肆提高广告投放 。
看上去有因果关系的数据,还要看数据集的比对性才可以给出数据最终的结果 。
控制数据范围——神枪手谬误
推荐阅读
- 济南3040万二手车市场,济南那个地方可以买到便宜二手车辆
- 高铁动车票提前多少时间订,上海春运可以什么提前多长时间订火车票
- 你知道自己的月亮星座吗 月亮星座查询
- 可以不装踢脚线吗
- 12星座性格小测试 测试自己真正星座
- 分享天猫精灵可以绑定网易云音乐吗。
- 最适合在一起的4个星座配对 星座配对
- 十二星座的专属口红色 十二星座专属口红
- 我来分享荣耀平板V7Pro玩游戏可不可以开90帧。
- 小米手环4可以打电话吗 小米手环4能拨打电话吗