从零开始学统计
  • 推荐0
  • 收藏0
  • 浏览569

从零开始学统计

归璐 (作者) 

  • 书  号:978-7-121-30165-0
  • 出版日期:2016-11-07
  • 页  数:180
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:黄爱萍
大数据时代,每个人都要懂一点统计学,我们缺的不是数据,而是正确分析数据的路径,从海量数据中撷取有用信息、产生新价值,甚至用以推估未知的事物,并且已经成为个人和企业的关键竞争力。这是一本关于统计轻知识的书,作者希望借助轻松幽默的语言来激发读者对统计学的学习热情。内容从描述性统计到推断性统计,通过将生活中有趣的事件一一展开,了解统计雪学中的核心知识点,最后是常见疑问的答疑汇编。本书偏重于对案例和图表的引用,不会过多关注于数学推导。
用最通俗易懂的文字解开“统计学”的神秘面纱,带你走入它的世界!
学统计的理由


Hi,亲。很高兴遇见你,虽然你看不到我,我也无法目睹你的容颜,但当你翻开这本书的时候,我们就已经通过文字这个载体见面了!
我猜你应该是被本书的标题吸引才会翻开它的吧?那么聪明的你应该知道,这是一本关于统计学的图书。统计学是一门有趣而实用的学科,它将会成为你生活、工作中的好帮手(别告诉我你不炒股、不玩微博、不买彩票,甚至不逛淘宝,你以为我会告诉你这些都和统计有关吗)。
? 想知道为什么不能赌博吗——学统计吧!
? 想知道为什么淘宝总能“猜透你的心”吗——学统计吧!
? 想知道怎样才能获得升职加薪的捷径吗——学统计吧!
你有没有想过买一张福利彩票,然后被五百万元大奖砸中?我就有过,那通常发生在大白天,我两眼呆滞且目光涣散,幻想自己抱着一堆红色的人民币傻乐……但是当我回过神来后,我就清楚地意识到中大奖的机会微乎其微——这是概率论教会我的。
你也许会想:这是我小时候就懂的道理,你还要读了概率论才知道。
要知道,概率论诞生于赌博游戏。一次两次的小赢,甚至接连几次都赢是有可能发生的,这属于概率的正常波动。其实,如果在完全公平的情况下,输赢概率应该各为50%。但为什么总感觉赌的时间越长,越容易输呢?这是因为我们忽视了一个重要的因素,那就是输赢各半的前提是可以进行无限多次的赌博,但事实是我们根本不可能有那么多的资金和精力。要知道,得出抛硬币正反面出现概率各为50%的结论,是建立在上万次试验结果之上的。所以,你若知道概率还蕴涵积分的数学思想,就不难理解为何“十赌九输”了。
你有没有想过,“万能”的淘宝为何总能在你搜索宝贝的时候顺便推送一些名为“猜你喜欢”的产品,而且这些推送有时还能被你成功加入购物车?其中就用到了推荐算法。推荐算法不仅涉及文本挖掘技术,而且与统计学中频率的计算和关联性知识有紧密联系。
在我们的日常工作中,如果你从事的是销售、财务工作,或者你是某项目的策划者,当领导询问你对即将上架的产品,或者要削减某项开支,或者某项目的推广方案的看法时,你该如何回答?
如果你对自己所做的工作有过翔实的数据采集,例如,对需要销售的产品做过统计,就可以得出一系列图表来证明该产品在某个时间段或针对某些特殊人群有明显的销量提升(这通常涉及方差分析);再如,你对公司的财务数据做了详细的台账记录,则可以清楚地知道缩减哪些开支既不影响生产销售又可以提高营业利润(这时可以运用相关分析);又如,你使用定量方法将推广方案的定性数据量化,通过分析得出最佳方案。试着使用数据来说话,慢慢培养统计思维,你会发现,你的工作将会事半功倍。
生命和统计息息相关
如果上述例子无法给你学习统计的充分理由,那么,当数据和生命联系在一起时,会是怎样呢?
手术中,麻醉师的用药剂量与病人的个体情况有着严格的匹配要求;新药物上市前,必须经过无数次试验检验;用药说明书上的剂量指导,更是建立在海量试验检验基础之上的。其中就涉及抽样调查、假设检验和实验设计等多种统计学的理论知识。
不久前,“雾霾致癌吗”这个话题异常火爆。关于这个命题的真伪,在此不做评述,但众所周知,吸烟是有害健康的,吸烟致癌也被大家广为接受。但你知不知道,“吸烟是否是引起肺癌的原因”这个论题曾经在统计学界掀起了轩然大波?当时,费希尔(统计学界的泰斗级人物)极力反对这个观点,其实,在证明吸烟与肺癌关系的过程中,更值得讨论的是对于试验的设计和流行病医学里的因果关系的论证。直到目前,仍然没有一种有效的方法能够证明统计和哲学双层面的因果关系。但随着统计学的飞速发展,医学统计逐渐流行起来,并发展成为一门热门学科。
生活中的每一部分都和统计密切相关
当一门学科发展到可以通过量化数据来解密人体科学的时候,还能说它不值得去学习了解吗?比如,在大数据时代,如果你不会两个统计名词,怎能充分利用大数据的价值?从事金融行业的不会数据分析,不能跑代码,怎么体现你的专业素养?如果没听说过什么是Hadoop/R/SAS,你怎么做合格的程序员?还有机器学习、词频分析、文本挖掘、数据挖掘……所有这些都离不开统计理论的支撑。所以,如果你想走在时代的前沿,就抓紧时间学统计吧!
当然,即使有千万个学习统计的理由,但总有一个理由会让你拒绝学习,那就是数学!你不热爱数学,所以你拒绝学习和数字有关的学科。但是,这并不能成为你不学习统计的理由,因为统计和数学并不相同。笔者认为,统计学就是“高冷”数学和深奥哲学的平衡点。
其实,笔者天生对数学没有兴趣,丝毫看不出那些积分符号优美在何处。但是这并不能阻碍笔者对统计学的热爱。诚然,统计理论是完全建立在数学基础上的,数理统计对数学的要求很高,但是统计学里还有一个分支叫应用统计,本书就是为了应用而生。
本书不会有繁冗的数学公式推导,不过在有些时候,为了说清楚问题,数学公式和定理是不可或缺的,笔者水平有限,力争通过通俗易懂的语言让大家明白统计是怎么回事、统计可以用来做些什么。
你不用惧怕巨大的计算量,这些都可以通过软件来完成。喜欢编程并想深入研究理论知识的,可以使用Stata、SAS、R;想要快速解决问题的,可以使用SPSS;甚至可以使用Excel完成绝大多数统计分析工作。
至此,你应该找不到不学统计的理由了吧?
欢迎大家和笔者一起进入奇妙的统计学世界!

目录

目 录


第0章 入门阶段——带你迈入统计学的大门 1
0.1 我和统计学的从零开始 1
0.2 统计学的从零开始 4
第1章 你的数据从何而来 10
1.1 “不可能完成的任务”——普查 11
1.2 “四两拨千斤”——事半功倍的抽样调查 13
☆本章重点归纳: 20
第2章 掌握指标学会数据分析 21
2.1 被误解还是“被平均” 21
2.1.1 数值平均数——最熟悉的陌生人 23
2.1.2 位置平均数——关键的排序 28
2.2 均值的好朋友——方差(标准差) 34
2.3 峰度&偏度——打造风度翩翩的数据分布 38
☆本章重点归纳: 40
第3章 图表的世界 42
必备技能1——频数分布表 42
必备技能2——频数分布图 46
必备技能3——茎叶图 48
必备技能4——箱线图 52
必备技能5:散点图 54
☆本章重点归纳: 61
第4章 当小“正太”遇上“大叔”——正太分布篇 63
4.1 小“正太”的基本情况 64
4.2 小“正太”的性格和优点——正态分布的定义和特征 65
4.3 小“正太”的可爱之处——正态分布的作用 68
☆本章知识点补充: 75
第5章 当小“正太”遇上“大叔”——大数定律和中心极限篇 77
5.1 正态分布的“左膀”——大数定律 77
5.2 正态分布的“右臂”——中心极限定理 80
5.3 如何牵手“大叔”和“正太” 83
☆本章重点归纳: 85
第6章 相关和因果切莫傻傻分不清楚 86
6.1 为了“不确定”的确定 86
6.1.1 散点图 87
6.1.2 相关系数 89
6.2 上帝掷骰子?! 94
☆本章知识拓展: 96
第7章 “小”亦可为,“大”而佐之 99
7.1 这个“小二”一点都不“二” 99
7.2 另辟蹊径的最大似然估计 102
7.3 他山之石,或可攻玉 106
☆本章知识拓展: 107
第8章 从先放牛奶or先放热茶说起 109
8.1 掀开假设检验的面纱 111
8.1.1 原假设VS备择假设 112
8.1.2 统计检验量和拒绝域 115
8.1.3 P值 117
8.2 几种常用假设检验简介 120
8.3 手把手教你做检验 123
☆本章知识拓展 126
第9章 回归分析——科学研究的“万金油” 128
9.2 释放“回归”的超能力 131
9.3 规避“回归”的误区(伪回归问题) 136
☆本章知识拓展 139
第10章 物以类聚,人以群分 142
10.1 分久必合——聚类分析 142
10.2 合久必分——判别分析 147
第11章 独辟蹊径,曲径通幽 152

读者评论

相关博文

  • 公式我都会,为何依然分析不好数据?

    管理员账号 2016-12-30

    开篇语: 你还在为是否要花两块钱去福彩赌一赌500万而踌躇?还在为时至今日依旧搞不懂大数据到底是什么而羞愧?还在为“统计学”这门看似烧脑的学科而望而却步不敢走进它的大门?来吧,《从零开始学统计》的作者归璐老师,带你走进统计学的世界,...

    管理员账号 2016-12-30
    191 0 0 0