统计数据之所以强大有力,原因在于它对我们的希望、梦想和信仰无动于衷——数据让我们客观地看待事物。不过,当人们不喜欢数据告诉我们的结果时,常常对其进行操纵……因此懂得解释统计数据,了解各种歪曲、滥用数据的技术对于理解数据真相是非常必要的。
本书教给读者神圣的技术,让你学会如何质疑“看得见”的数据,并挖出“看不见”的数据真相,还原基本的事实。
引 言
“数学是宇宙与人类交流及吐露真相的方式。”
——伽利略
“数学比其他任何在人类社会中传承的知识结构更
为强大有力。”
——笛卡儿
“数字是最高级别的知识。它就是知识本身。”
——柏拉图
统计之所以如此美丽、如此强大有力,原因在于它对我们的希望、梦
想和信仰无动于衷——统计让我们客观地看待事物。可惜,统计数据常常
被当作裁判,当我们不喜欢统计数据告诉我们的结果时,我们可以与之辩
论,对其操纵。下面的实例提醒我们,忽视统计数据传递的信息极为危险。
1999 年,一家大型制药企业的一种名为万络(Vioxx)的轰动一时的止
痛药物进入最后试验阶段。万络能止痛,却不像阿司匹林那样会引发胃肠
道并发症,它前途无量,不仅有可能帮助成千上万的人,而且能为制药厂
赚取数十亿元的真金白银。
制药公司明白,必须小心对待万络的最终试验——尤其必须要小心选
择万络的竞争药物,经过深思熟虑,制药公司决定选择萘普生(Aleve)作
为试验竞争药物(因为这种药物对心脏病是否有防护作用还未知)。
9 个月以后,经过对临床数据进行分析,得出了惊人的结果!服用万
络的试验组发作心脏病的次数是服用萘普生的试验组发作心脏病的次数的
4 倍。统计结果提供的信息非常清楚——万络是心脏病发作的重大原因,
这一点可能性很大。
可惜,解释统计数据的人往往做不到或不愿意客观地审视统计数据,
他们很容易受到才能、意愿和贪婪的影响。因此,研究结论未指出万络导
致心脏病发病风险提高400%,而是指出萘普生导致心血管疾病的发病率降
低80%。这个解释让人难以置信,因为,前面已经提到,萘普生不像阿司
匹林,它对心脏的保护作用尚未可知。实际上,如果萘普生确实能将心脏
病发病风险降低80%,那么它的效果将达到阿司匹林的2~3 倍!
尽管临床实验清楚地表明万络存在危险,万络还是得到美国食品和药
品管理局(FDA)的批准,随后被数百万人选用。4 年以后,万络从市场
上被撤下,然而这时它引发的心脏病以及死亡人数已经令人胆寒。FDA 估
计万络引发了88 000 至139 000 例心脏病——其中30%~40%致命。1
在万络/萘普生研究中得到的统计值显示出清晰的信息,但这些信息遭
到忽视,造成千上万人死去。
这些话是伽利略、笛卡儿、柏拉图对数学的力量的真知灼见。统计的
力量在我们的社会中已经作用了数百年;使用得当时,这种力量有可能拯
救数百万人的性命。可惜,“统计警告”被歪曲、操纵、最小化的例子不胜
枚举。这种知识和道德上的失败所造成的结果是——数百万人丧失本来不
必丧失的生命。
我们对于下列问题的统计警告实在反应太慢:
? 烟草
? 石棉
? 苯
? 万络
? 胃药
? 铅
? 赖式综合症/阿司匹林关系
? 酒精
由于滥用、操纵统计数据造成的惨剧不应该致使我们相信——统计永
远会被操纵,永远无用,永远不可信。每一例不恰当使用统计的意外事件
总是对应着上百例公正、合理使用统计的实例——这给社会带来极大好处。
下列5 个实例向我们展示了统计的有利用途:
? 有一个统计模型帮助人们在18 个月里防止了100 000 多例由于医院
过错导致的死亡。
? 奥克兰运动家队聘用队员的薪水差不多是业界最低的,却依靠统计
成为最佳棒球队之一。
? 事实证明,一个数学公式比一群专业品酒师能更准确地预测出葡萄
酒的质量。
? 一个统计模型比一群全国著名的法律专家能更准确地预测出最高
法院的投票结果。
? 统计被用于帮助急诊室医生做出更好的判断。
统计具有改善我们生活的能力,因此,懂得如何使用统计是我们的基
本要求。此外,由于操纵、欺诈和彻头彻尾的谎言常常伴随统计登场,懂
得解释统计数据,对各种歪曲、滥用数据的技术有所了解也非常必要。
在阅读本书的过程中,有一些例子可能会引读者发笑,有一些则令读
者愤慨。我希望,在读完本书后,读者不仅懂得如何质疑自己看见的统计
数据,而且能够明白:统计学习并非人们常说的那样枯燥、乏味。