论文部分内容阅读
废话一箩筐
冷静地想一想,你就会发现他们的数据纯粹是一堆废话。
一群医药厂商资助的科研人员发表了一个研究报告,列举了大量调查数据证明,经过某种新型药物治疗,95%的感冒患者能够在一个星期内被治愈。于是大肆宣传他们找到了攻克感冒的灵丹妙药。但人们却忽略了一个事实——即使不打针吃药,一般而言,感冒也能在七天内自行痊愈。
1898年美西战争期间,美国海军的死亡率是9%,而同时期纽约市居民的死亡率是16%,后来美国海军征兵人员就用这些数据来证明参军更安全。然而这两组对象是不可比的。海军主要由那些体格健壮的年轻人组成,而城市居民包括了婴儿、老人、病人,他们无论在哪儿死亡率都比较高。这些数据根本不能证明身强力壮的棒小伙在海军服役比在其他地方工作有更高的存活机会。
正确的数据,错误的结论
你得到正确的统计数据,可是如果你不仔细考虑背后的原因,就可能得出错误的结论。
1952年,美国加利福尼亚州中部山谷报告的脑炎患者人数是历史最高水平的3倍。许多受惊吓的居民扶老携幼迁出该州。但如果认真调查,就会发现脑炎“增加”的原因是过去该地区医疗条件比较差,很多人即使得了病也没人知道。后来政府派了许多医务工作者到这里来,在他们的努力之下,许多以前没有检查出来的脑炎患者都被确诊,记录在案的病例数量自然就增加了。
统计数字还表明,在美国亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病?恰好相反。亚利桑那的气候对患肺病的人有好处,所以肺病患者纷纷前来,自然就使这个州死于肺结核的平均数升高了。
再比如中国人常常认为龙年出生的小孩更有出息。统计结果似乎也表明龙年出生者有更多的成功人士!但人们很少注意到这样一个事实:正由于上述认识,许多人喜欢在龙年生育,以致每个龙年都是出生高峰。可以想见,由于出生人数多,因此即使成功几率相同,龙年出生的成功人士也肯定要比其他年份多!
这类有趣的误会还有很多。比如统计资料表明,大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全?绝不是这样。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢?不是,统计只不过反映了人们往往是在离家不远的地方开车……
不能放在一起比
一些根本不搭界的东西的数据被放在一起,结果得出的自然是牛头不对马嘴的结论。
比如在一个城市里,社会调查发现冰激凌的销量与犯罪率成正比,人们吃的冰激凌越多,犯罪率就越高,吃的冰激凌越少,犯罪率就越低。于是新当选的市议员便兴高采烈地提出议案——在夏天这几个月限制冰激凌的消费量,以便使犯罪率下降。很明显,犯罪不是吃冰激凌造成的,只不过夏天室外气温变暖,白天更长,人们多开窗户,就会诱发更多的犯罪。夏天人们也喜欢吃冰激凌,但这跟犯罪率没有关联。
一项研究表明:在某个城市心力衰竭而死亡的人数和啤酒的消耗量都急剧升高。这是否表示喝啤酒会引起心脏病发作?不!两种情况的增加都是人口迅速增加的结果。若按同样的理由,心脏病发作还可以归咎于上百个其他因素,如咖啡消耗量增加,嚼口香糖的人增多,玩桥牌更加盛行,更多的人看电视,等等。
究竟谁比谁强?
很多体育比赛中,人们喜欢比较选手之间的胜负率,并以此预测比赛的结果。
如在乒乓球比赛上,奥运会冠军王涛在过去与世乒赛三冠王王励勤的多次较量中,胜率达到了60%。而王励勤过去与四届世界杯冠军马琳的较量中,胜率同样达到了60%。既然这样,当王涛决战马琳的时候,是不是可以认定王涛获胜几率更大呢?NO!统计数据只是两两比较,不具有传递性。搞不好马琳对王涛的胜率也高达60%呢。
在工商业界,这种误区也很常见。一个统计学家也许会发现,有2/3家庭妇女喜好润肤霜A超过B,2/3的喜好B超过C。化学公司得知这一结果后,也许就将润肤霜C作为最不受欢迎的一种而降低产量,孰不知第三个统计可能会表明还有2/3的人喜欢C超过A呢。
千万不要被貌似权威的数据吓倒,真实的数据也会骗人,用事实说话可能说的却是废话。只有开动脑筋,才能拨云开雾,发现真相。
北野摘自《大科技·百科新说》 编辑/乃清
冷静地想一想,你就会发现他们的数据纯粹是一堆废话。
一群医药厂商资助的科研人员发表了一个研究报告,列举了大量调查数据证明,经过某种新型药物治疗,95%的感冒患者能够在一个星期内被治愈。于是大肆宣传他们找到了攻克感冒的灵丹妙药。但人们却忽略了一个事实——即使不打针吃药,一般而言,感冒也能在七天内自行痊愈。
1898年美西战争期间,美国海军的死亡率是9%,而同时期纽约市居民的死亡率是16%,后来美国海军征兵人员就用这些数据来证明参军更安全。然而这两组对象是不可比的。海军主要由那些体格健壮的年轻人组成,而城市居民包括了婴儿、老人、病人,他们无论在哪儿死亡率都比较高。这些数据根本不能证明身强力壮的棒小伙在海军服役比在其他地方工作有更高的存活机会。
正确的数据,错误的结论
你得到正确的统计数据,可是如果你不仔细考虑背后的原因,就可能得出错误的结论。
1952年,美国加利福尼亚州中部山谷报告的脑炎患者人数是历史最高水平的3倍。许多受惊吓的居民扶老携幼迁出该州。但如果认真调查,就会发现脑炎“增加”的原因是过去该地区医疗条件比较差,很多人即使得了病也没人知道。后来政府派了许多医务工作者到这里来,在他们的努力之下,许多以前没有检查出来的脑炎患者都被确诊,记录在案的病例数量自然就增加了。
统计数字还表明,在美国亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病?恰好相反。亚利桑那的气候对患肺病的人有好处,所以肺病患者纷纷前来,自然就使这个州死于肺结核的平均数升高了。
再比如中国人常常认为龙年出生的小孩更有出息。统计结果似乎也表明龙年出生者有更多的成功人士!但人们很少注意到这样一个事实:正由于上述认识,许多人喜欢在龙年生育,以致每个龙年都是出生高峰。可以想见,由于出生人数多,因此即使成功几率相同,龙年出生的成功人士也肯定要比其他年份多!
这类有趣的误会还有很多。比如统计资料表明,大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全?绝不是这样。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢?不是,统计只不过反映了人们往往是在离家不远的地方开车……
不能放在一起比
一些根本不搭界的东西的数据被放在一起,结果得出的自然是牛头不对马嘴的结论。
比如在一个城市里,社会调查发现冰激凌的销量与犯罪率成正比,人们吃的冰激凌越多,犯罪率就越高,吃的冰激凌越少,犯罪率就越低。于是新当选的市议员便兴高采烈地提出议案——在夏天这几个月限制冰激凌的消费量,以便使犯罪率下降。很明显,犯罪不是吃冰激凌造成的,只不过夏天室外气温变暖,白天更长,人们多开窗户,就会诱发更多的犯罪。夏天人们也喜欢吃冰激凌,但这跟犯罪率没有关联。
一项研究表明:在某个城市心力衰竭而死亡的人数和啤酒的消耗量都急剧升高。这是否表示喝啤酒会引起心脏病发作?不!两种情况的增加都是人口迅速增加的结果。若按同样的理由,心脏病发作还可以归咎于上百个其他因素,如咖啡消耗量增加,嚼口香糖的人增多,玩桥牌更加盛行,更多的人看电视,等等。
究竟谁比谁强?
很多体育比赛中,人们喜欢比较选手之间的胜负率,并以此预测比赛的结果。
如在乒乓球比赛上,奥运会冠军王涛在过去与世乒赛三冠王王励勤的多次较量中,胜率达到了60%。而王励勤过去与四届世界杯冠军马琳的较量中,胜率同样达到了60%。既然这样,当王涛决战马琳的时候,是不是可以认定王涛获胜几率更大呢?NO!统计数据只是两两比较,不具有传递性。搞不好马琳对王涛的胜率也高达60%呢。
在工商业界,这种误区也很常见。一个统计学家也许会发现,有2/3家庭妇女喜好润肤霜A超过B,2/3的喜好B超过C。化学公司得知这一结果后,也许就将润肤霜C作为最不受欢迎的一种而降低产量,孰不知第三个统计可能会表明还有2/3的人喜欢C超过A呢。
千万不要被貌似权威的数据吓倒,真实的数据也会骗人,用事实说话可能说的却是废话。只有开动脑筋,才能拨云开雾,发现真相。
北野摘自《大科技·百科新说》 编辑/乃清