人人都会数据分析——从生活实例学统计
  • 推荐0
  • 收藏7
  • 浏览2.5K

人人都会数据分析——从生活实例学统计

谢运恩 (作者) 

  • 书  号:978-7-121-32966-1
  • 出版日期:2017-11-29
  • 页  数:288
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:王静
电子书 ¥29.00
购买电子书
纸质版 ¥59.00
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。
本书系统地介绍了数据分析的统计理论基础内容,共5章。第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析内容,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形的功能及使用场景。
本书以数据分析的统计理论基础为主题,大多数知识点都列举了生活中的实用案例,适合高等院校学生、公司职员、个体商户和企业管理者学习参考。
帮助读者建立统计理论知识框架,形成数据分析思维逻辑,学会数据分析方法
前言

人人都应该会数据分析
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员、个体商户、大公司管理者都需要有数据分析的能力。很多人认为数据分析能力就是对数据进行描述和做出漂亮统计图形的能力,这是狭隘的理解。数据分析能力的基础在与数据分析的逻辑思维能力,而逻辑思维能力的培养必须建立在统计理论基础之上。

统计学是数据分析的基础
在移动互联网时代,信息的获取成本越来越低,这也导致拿来主义和实用主义盛行。数据分析科学是一门需要紧密联系生活实际的科学。数据分析方法非常多,这是因为不同的数据分析环境需要选择不同的数据分析方法来处理,因此在数据和数据分析方法之间,天然地存在鸿沟,拿来主义和实用主义经常行不通,而磨平鸿沟的方法就是学习统计理论基础。

笔者接触过很多希望学习数据分析或正在学习数据分析的朋友,发现他们身上都有一个通病,就是将学习各种分析软件作为学习重点,觉得学习数据分析就是学习分析软件操作。他们在进行具体数据分析时,通常的做法是套用别人的数据分析逻辑和方法,如果分析结果与参考结果一致,那么没有问题,但是通常的情况是不一致,这时他们就需要浪费大量的时间和精力查找原因。而不一致的原因通常是数据情况不符合导致的,解决的办法是根据实际的数据分析环境进行数据调整或选择其他合适的数据分析方法,而要做到这些,归根结底需要的还是扎实的统计理论基础。

学习数据分析应该以统计理论基础为主线,分析软件仅仅是各种分析方法的实现工具,因此在开始学习时,应该附以一到两种操作简便的分析软件,例如SPSS。这样就能够比较快速地建立统计理论框架,并掌握一款分析软件。当你的统计理论基础夯打扎实以后,会发现学习各种分析软件都能够游刃有余,甚至像R和Python这种需要编程语言的软件也能在比较短的时间内掌握。

从生活案例开始学统计学
标准版的统计教材往往偏重于理论推导,描述语言专业严谨,这不可避免地带来了晦涩难懂的问题。本书的写作初衷就是为了解决没有任何统计基础的各行各业的数据分析学习者,他们学习和构建自己统计理论基础的需求,大部分知识点都列举了生活中的应用案例,能够帮助学习者更好地理解和掌握各个知识点的分析逻辑,并内化为自己的统计理论基础的知识框架。
除此之外,本书在章节设计上做了精心的安排,共包括5章。
第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径。
第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据。
第3章为推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征。
第4章为预测分析内容,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,过去的历史数据信息预测未来可能出现的数据信息。
第5章是数据结果可视化的内容,包括了各种统计图形的功能及使用场景。

“不积跬步,无以至千里”,夯打基础的过程总是比较乏味痛苦的,希望本书通俗的描述语言和鲜活的生活应用案例能够帮助数据分析学习者顺利的建立统计理论知识框架,形成数据分析思维逻辑,成为各自领域的佼佼者。

目录

第1 章 生活在数据时代 1
1.1 数据分析无处不在 2
1.1.1 常用的国家统计指标 2
1.1.2 制造业的数据分析应用 .9
1.1.3 营销领域的数据分析应用 13
1.1.4 医疗行业的数据分析应用 15
1.2 人人都能成为数据分析师 16
1.2.1 数据分析过程 17
1.2.2 数据分析工具 21
1.2.3 数据分析师的成长之路 26
第2 章 耳熟能详的数据你真的了解吗 29
2.1 数据的类型 30
2.1.1 数据的结构属性分类 30
2.1.2 数据的连续性特征分类 . 31
2.1.3 数据的测量尺度分类 . 33
2.2 数据描述的三个维度 35
2.3 数据的集中趋势描述 36
2.3.1 算术平均值 . 37
2.3.2 几何平均值 . 39
2.3.3 众数 . 40
2.3.4 中位数 . 41
2.4 数据的离散程度描述 42
2.4.1 极差 . 42
2.4.2 平均偏差 . 43
2.4.3 方差和标准差 . 44
2.4.4 变异系数 . 48
2.4.5 四分位极差 . 49
2.5 数据的分布形态描述 50
2.5.1 概率 . 50
2.5.2 概率分布 . 53
2.5.3 离散型概率分布:二项分布 . 54
2.5.4 离散型概率分布:多项分布 . 56
2.5.5 离散型概率分布:超几何分布 . 57
2.5.6 离散型概率分布:泊松分布 . 59
2.5.7 连续型概率分布:指数分布 . 62
2.5.8 连续型概率分布:均匀分布 . 65
2.5.9 连续型概率分布:正态分布 . 66
2.5.10 正态分布作为二项分布近似 . 73
2.5.11 正态分布作为泊松分布近似 . 76
第3 章 数据分析的“内核”:推断分析 . 79
3.1 见微知著的抽样 80
3.1.1 抽样的意义 . 80
3.1.2 抽样方法 . 81
3.1.3 样本推断的理论基础 . 84
3.2 数据的处理 86
3.2.1 数据处理的不良案例 . 86
3.2.2 正确的数据存储形式 . 87
3.3 样本到总体的桥梁:抽样分布 88
3.3.1 抽样分布的定义 . 88
3.3.2 ??分布 90
3.3.3 ??分布 95
3.3.4 切比雪夫定理 . 98
3.3.5 卡方(??2)分布 99
3.3.6 ??分布 100
3.4 数据分析的第一板“斧”:参数估计. 102
3.4.1 参数估计的类型 . 102
3.4.2 ??分布与总体均值的区间估计 . 104
3.4.3 ??分布与总体均值的区间估计 110
3.4.4 切比雪夫定理与总体均值的区间估计 113
3.4.5 卡方(??2)分布与总体方差的区间估计 115
3.4.6 ??分布与两个总体方差比的区间估计 .119
3.4.7 两个总体均值差的区间估计 . 121
3.4.8 总体比率的区间估计 . 133
3.4.9 样本容量的确定 . 135
3.5 数据分析的第二板“斧”:假设检验. 142
3.5.1 假设检验的理论基础 . 142
3.5.2 单样本的假设检验 . 150
3.5.3 两样本的假设检验 . 159
3.5.4 多样本的假设检验与方差分析 . 166
3.6 数据分析的第三板“斧”:非参数检验 . 184
3.6.1 非参数检验 . 185
3.6.2 卡方检验 . 187
3.6.3 ????????????????符号秩检验 191
第4 章 数据分析的终极目的:“为我所用” . 195
4.1 “相关”是继续分析的前提 196
4.1.1 相关关系 . 196
4.1.2 相关分析 . 198
4.2 “回归”是相关分析的归宿 209
4.2.1 回归分析综述 . 209
4.2.2 简单线性回归分析 211
4.2.3 多元线性回归分析 . 226
4.3 发现事物随时间变化的规律 235
4.3.1 时间序列分析综述 . 235
4.3.2 长期趋势分析 . 238
4.3.3 季节变动趋势分析 . 248
4.3.4 循环变动和不规则变动 . 252
4.3.5 时间序列分析应用 . 254
第5 章 给数据披上靓丽“外衣”:数据可视化 259
5.1 数据的可视化 260
5.1.1 数据可视化工具 . 260
5.1.2 常用的统计图 . 261
5.2 条形图、直方图和饼图 262
5.2.1 条形图 . 262
5.2.2 直方图 . 264
5.2.3 饼图 . 266
5.3 线图与面积图 267
5.3.1 线图 . 267
5.3.2 面积图 . 267
5.4 散点图 268
5.5 高低图与箱线图 270
5.5.1 高低图 . 270
5.5.2 箱线图 . 271
5.6 时间序列图 272
5.7 帕累托图 274
5.8 P-P 概率图和Q-Q 概率图 275
5.8.1 P-P 概率图 275
5.8.2 Q-Q 概率图 . 276

本书勘误

印次
  • 页码:9  •  行数:10  •  印次: 1

    1.1.2节中made in China 写成ade in China

    moqiyanruo 提交于 2018/10/15 16:04:05
    王静 确认于 2018/12/4 11:27:05

读者评论

电子书版本

  • Epub

相关图书

Python统计可视化之Altair探索分析实践指南

刘大成 (作者)

本书以Altair为核心工具,通过认识数据、理解数据和探索数据全方位地探索分析数据集的统计可视化形式,以应用数据和案例研究为实践场景,使用Altair数据加工箱...

 

实用推荐系统

Kim Falk (作者) 李源 朱罡罡 温睿 (译者)

要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建...

¥119.00

Kubernetes权威指南:从Docker到Kubernetes实践全接触(第5版)

龚正 吴治辉 闫健勇 (作者)

Kubernetes是由谷歌开源的容器集群管理系统,为容器化应用提供了资源调度、部署运行、服务发现、扩缩容等一整套功能。Kubernetes也是将“一切以服务(...

 

Harbor权威指南

张海宁 邹佳 王岩 尹文开 任茂盛 等 (作者)

在云原生生态中,容器镜像和其他云原生制品的管理与分发是至关重要的一环。本书对开源云原生制品仓库Harbor展开全面讲解,由Harbor开源项目维护者和贡献者倾力...

 

集成学习:基础与算法

Zhi-Hua Zhou (作者) 李楠 (译者)

集成学习方法是一类先进的机器学习方法,这类方法训练多个学习器并将它们结合起来解决一个问题,在实践中获得了巨大成功。<br>全书分为三部分。第一部分主要介绍集成学...

¥89.00

Kubernetes源码剖析

郑东旭 (作者)

本书主要分析了Kubernetes核心功能的实现原理,是一本帮助读者了解Kubernetes架构设计及内部原理实现的书。由于Kubernetes代码量较大,源码...