大数据时代,每个人都要懂一点统计学,我们缺的不是数据,而是正确分析数据的路径,从海量数据中撷取有用信息、产生新价值,甚至用以推估未知的事物,并且已经成为个人和企业的关键竞争力。这是一本关于统计轻知识的书,作者希望借助轻松幽默的语言来激发读者对统计学的学习热情。内容从描述性统计到推断性统计,通过将生活中有趣的事件一一展开,了解统计雪学中的核心知识点,最后是常见疑问的答疑汇编。本书偏重于对案例和图表的引用,不会过多关注于数学推导。
用最通俗易懂的文字解开“统计学”的神秘面纱,带你走入它的世界!
学统计的理由
Hi,亲。很高兴遇见你,虽然你看不到我,我也无法目睹你的容颜,但当你翻开这本书的时候,我们就已经通过文字这个载体见面了!
我猜你应该是被本书的标题吸引才会翻开它的吧?那么聪明的你应该知道,这是一本关于统计学的图书。统计学是一门有趣而实用的学科,它将会成为你生活、工作中的好帮手(别告诉我你不炒股、不玩微博、不买彩票,甚至不逛淘宝,你以为我会告诉你这些都和统计有关吗)。
? 想知道为什么不能赌博吗——学统计吧!
? 想知道为什么淘宝总能“猜透你的心”吗——学统计吧!
? 想知道怎样才能获得升职加薪的捷径吗——学统计吧!
你有没有想过买一张福利彩票,然后被五百万元大奖砸中?我就有过,那通常发生在大白天,我两眼呆滞且目光涣散,幻想自己抱着一堆红色的人民币傻乐……但是当我回过神来后,我就清楚地意识到中大奖的机会微乎其微——这是概率论教会我的。
你也许会想:这是我小时候就懂的道理,你还要读了概率论才知道。
要知道,概率论诞生于赌博游戏。一次两次的小赢,甚至接连几次都赢是有可能发生的,这属于概率的正常波动。其实,如果在完全公平的情况下,输赢概率应该各为50%。但为什么总感觉赌的时间越长,越容易输呢?这是因为我们忽视了一个重要的因素,那就是输赢各半的前提是可以进行无限多次的赌博,但事实是我们根本不可能有那么多的资金和精力。要知道,得出抛硬币正反面出现概率各为50%的结论,是建立在上万次试验结果之上的。所以,你若知道概率还蕴涵积分的数学思想,就不难理解为何“十赌九输”了。
你有没有想过,“万能”的淘宝为何总能在你搜索宝贝的时候顺便推送一些名为“猜你喜欢”的产品,而且这些推送有时还能被你成功加入购物车?其中就用到了推荐算法。推荐算法不仅涉及文本挖掘技术,而且与统计学中频率的计算和关联性知识有紧密联系。
在我们的日常工作中,如果你从事的是销售、财务工作,或者你是某项目的策划者,当领导询问你对即将上架的产品,或者要削减某项开支,或者某项目的推广方案的看法时,你该如何回答?
如果你对自己所做的工作有过翔实的数据采集,例如,对需要销售的产品做过统计,就可以得出一系列图表来证明该产品在某个时间段或针对某些特殊人群有明显的销量提升(这通常涉及方差分析);再如,你对公司的财务数据做了详细的台账记录,则可以清楚地知道缩减哪些开支既不影响生产销售又可以提高营业利润(这时可以运用相关分析);又如,你使用定量方法将推广方案的定性数据量化,通过分析得出最佳方案。试着使用数据来说话,慢慢培养统计思维,你会发现,你的工作将会事半功倍。
生命和统计息息相关
如果上述例子无法给你学习统计的充分理由,那么,当数据和生命联系在一起时,会是怎样呢?
手术中,麻醉师的用药剂量与病人的个体情况有着严格的匹配要求;新药物上市前,必须经过无数次试验检验;用药说明书上的剂量指导,更是建立在海量试验检验基础之上的。其中就涉及抽样调查、假设检验和实验设计等多种统计学的理论知识。
不久前,“雾霾致癌吗”这个话题异常火爆。关于这个命题的真伪,在此不做评述,但众所周知,吸烟是有害健康的,吸烟致癌也被大家广为接受。但你知不知道,“吸烟是否是引起肺癌的原因”这个论题曾经在统计学界掀起了轩然大波?当时,费希尔(统计学界的泰斗级人物)极力反对这个观点,其实,在证明吸烟与肺癌关系的过程中,更值得讨论的是对于试验的设计和流行病医学里的因果关系的论证。直到目前,仍然没有一种有效的方法能够证明统计和哲学双层面的因果关系。但随着统计学的飞速发展,医学统计逐渐流行起来,并发展成为一门热门学科。
生活中的每一部分都和统计密切相关
当一门学科发展到可以通过量化数据来解密人体科学的时候,还能说它不值得去学习了解吗?比如,在大数据时代,如果你不会两个统计名词,怎能充分利用大数据的价值?从事金融行业的不会数据分析,不能跑代码,怎么体现你的专业素养?如果没听说过什么是Hadoop/R/SAS,你怎么做合格的程序员?还有机器学习、词频分析、文本挖掘、数据挖掘……所有这些都离不开统计理论的支撑。所以,如果你想走在时代的前沿,就抓紧时间学统计吧!
当然,即使有千万个学习统计的理由,但总有一个理由会让你拒绝学习,那就是数学!你不热爱数学,所以你拒绝学习和数字有关的学科。但是,这并不能成为你不学习统计的理由,因为统计和数学并不相同。笔者认为,统计学就是“高冷”数学和深奥哲学的平衡点。
其实,笔者天生对数学没有兴趣,丝毫看不出那些积分符号优美在何处。但是这并不能阻碍笔者对统计学的热爱。诚然,统计理论是完全建立在数学基础上的,数理统计对数学的要求很高,但是统计学里还有一个分支叫应用统计,本书就是为了应用而生。
本书不会有繁冗的数学公式推导,不过在有些时候,为了说清楚问题,数学公式和定理是不可或缺的,笔者水平有限,力争通过通俗易懂的语言让大家明白统计是怎么回事、统计可以用来做些什么。
你不用惧怕巨大的计算量,这些都可以通过软件来完成。喜欢编程并想深入研究理论知识的,可以使用Stata、SAS、R;想要快速解决问题的,可以使用SPSS;甚至可以使用Excel完成绝大多数统计分析工作。
至此,你应该找不到不学统计的理由了吧?
欢迎大家和笔者一起进入奇妙的统计学世界!