人人都会数据分析——从生活实例学统计
  • 推荐0
  • 收藏7
  • 浏览1.4K

人人都会数据分析——从生活实例学统计

谢运恩 (作者) 

  • 书  号:978-7-121-32966-1
  • 出版日期:2017-11-29
  • 页  数:288
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:王静
电子书 ¥29.00
购买电子书
纸质版 ¥59.00
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。
本书系统地介绍了数据分析的统计理论基础内容,共5章。第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析内容,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形的功能及使用场景。
本书以数据分析的统计理论基础为主题,大多数知识点都列举了生活中的实用案例,适合高等院校学生、公司职员、个体商户和企业管理者学习参考。
帮助读者建立统计理论知识框架,形成数据分析思维逻辑,学会数据分析方法
前言

人人都应该会数据分析
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员、个体商户、大公司管理者都需要有数据分析的能力。很多人认为数据分析能力就是对数据进行描述和做出漂亮统计图形的能力,这是狭隘的理解。数据分析能力的基础在与数据分析的逻辑思维能力,而逻辑思维能力的培养必须建立在统计理论基础之上。

统计学是数据分析的基础
在移动互联网时代,信息的获取成本越来越低,这也导致拿来主义和实用主义盛行。数据分析科学是一门需要紧密联系生活实际的科学。数据分析方法非常多,这是因为不同的数据分析环境需要选择不同的数据分析方法来处理,因此在数据和数据分析方法之间,天然地存在鸿沟,拿来主义和实用主义经常行不通,而磨平鸿沟的方法就是学习统计理论基础。

笔者接触过很多希望学习数据分析或正在学习数据分析的朋友,发现他们身上都有一个通病,就是将学习各种分析软件作为学习重点,觉得学习数据分析就是学习分析软件操作。他们在进行具体数据分析时,通常的做法是套用别人的数据分析逻辑和方法,如果分析结果与参考结果一致,那么没有问题,但是通常的情况是不一致,这时他们就需要浪费大量的时间和精力查找原因。而不一致的原因通常是数据情况不符合导致的,解决的办法是根据实际的数据分析环境进行数据调整或选择其他合适的数据分析方法,而要做到这些,归根结底需要的还是扎实的统计理论基础。

学习数据分析应该以统计理论基础为主线,分析软件仅仅是各种分析方法的实现工具,因此在开始学习时,应该附以一到两种操作简便的分析软件,例如SPSS。这样就能够比较快速地建立统计理论框架,并掌握一款分析软件。当你的统计理论基础夯打扎实以后,会发现学习各种分析软件都能够游刃有余,甚至像R和Python这种需要编程语言的软件也能在比较短的时间内掌握。

从生活案例开始学统计学
标准版的统计教材往往偏重于理论推导,描述语言专业严谨,这不可避免地带来了晦涩难懂的问题。本书的写作初衷就是为了解决没有任何统计基础的各行各业的数据分析学习者,他们学习和构建自己统计理论基础的需求,大部分知识点都列举了生活中的应用案例,能够帮助学习者更好地理解和掌握各个知识点的分析逻辑,并内化为自己的统计理论基础的知识框架。
除此之外,本书在章节设计上做了精心的安排,共包括5章。
第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径。
第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据。
第3章为推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征。
第4章为预测分析内容,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,过去的历史数据信息预测未来可能出现的数据信息。
第5章是数据结果可视化的内容,包括了各种统计图形的功能及使用场景。

“不积跬步,无以至千里”,夯打基础的过程总是比较乏味痛苦的,希望本书通俗的描述语言和鲜活的生活应用案例能够帮助数据分析学习者顺利的建立统计理论知识框架,形成数据分析思维逻辑,成为各自领域的佼佼者。

目录

第1 章 生活在数据时代 1
1.1 数据分析无处不在 2
1.1.1 常用的国家统计指标 2
1.1.2 制造业的数据分析应用 .9
1.1.3 营销领域的数据分析应用 13
1.1.4 医疗行业的数据分析应用 15
1.2 人人都能成为数据分析师 16
1.2.1 数据分析过程 17
1.2.2 数据分析工具 21
1.2.3 数据分析师的成长之路 26
第2 章 耳熟能详的数据你真的了解吗 29
2.1 数据的类型 30
2.1.1 数据的结构属性分类 30
2.1.2 数据的连续性特征分类 . 31
2.1.3 数据的测量尺度分类 . 33
2.2 数据描述的三个维度 35
2.3 数据的集中趋势描述 36
2.3.1 算术平均值 . 37
2.3.2 几何平均值 . 39
2.3.3 众数 . 40
2.3.4 中位数 . 41
2.4 数据的离散程度描述 42
2.4.1 极差 . 42
2.4.2 平均偏差 . 43
2.4.3 方差和标准差 . 44
2.4.4 变异系数 . 48
2.4.5 四分位极差 . 49
2.5 数据的分布形态描述 50
2.5.1 概率 . 50
2.5.2 概率分布 . 53
2.5.3 离散型概率分布:二项分布 . 54
2.5.4 离散型概率分布:多项分布 . 56
2.5.5 离散型概率分布:超几何分布 . 57
2.5.6 离散型概率分布:泊松分布 . 59
2.5.7 连续型概率分布:指数分布 . 62
2.5.8 连续型概率分布:均匀分布 . 65
2.5.9 连续型概率分布:正态分布 . 66
2.5.10 正态分布作为二项分布近似 . 73
2.5.11 正态分布作为泊松分布近似 . 76
第3 章 数据分析的“内核”:推断分析 . 79
3.1 见微知著的抽样 80
3.1.1 抽样的意义 . 80
3.1.2 抽样方法 . 81
3.1.3 样本推断的理论基础 . 84
3.2 数据的处理 86
3.2.1 数据处理的不良案例 . 86
3.2.2 正确的数据存储形式 . 87
3.3 样本到总体的桥梁:抽样分布 88
3.3.1 抽样分布的定义 . 88
3.3.2 ??分布 90
3.3.3 ??分布 95
3.3.4 切比雪夫定理 . 98
3.3.5 卡方(??2)分布 99
3.3.6 ??分布 100
3.4 数据分析的第一板“斧”:参数估计. 102
3.4.1 参数估计的类型 . 102
3.4.2 ??分布与总体均值的区间估计 . 104
3.4.3 ??分布与总体均值的区间估计 110
3.4.4 切比雪夫定理与总体均值的区间估计 113
3.4.5 卡方(??2)分布与总体方差的区间估计 115
3.4.6 ??分布与两个总体方差比的区间估计 .119
3.4.7 两个总体均值差的区间估计 . 121
3.4.8 总体比率的区间估计 . 133
3.4.9 样本容量的确定 . 135
3.5 数据分析的第二板“斧”:假设检验. 142
3.5.1 假设检验的理论基础 . 142
3.5.2 单样本的假设检验 . 150
3.5.3 两样本的假设检验 . 159
3.5.4 多样本的假设检验与方差分析 . 166
3.6 数据分析的第三板“斧”:非参数检验 . 184
3.6.1 非参数检验 . 185
3.6.2 卡方检验 . 187
3.6.3 ????????????????符号秩检验 191
第4 章 数据分析的终极目的:“为我所用” . 195
4.1 “相关”是继续分析的前提 196
4.1.1 相关关系 . 196
4.1.2 相关分析 . 198
4.2 “回归”是相关分析的归宿 209
4.2.1 回归分析综述 . 209
4.2.2 简单线性回归分析 211
4.2.3 多元线性回归分析 . 226
4.3 发现事物随时间变化的规律 235
4.3.1 时间序列分析综述 . 235
4.3.2 长期趋势分析 . 238
4.3.3 季节变动趋势分析 . 248
4.3.4 循环变动和不规则变动 . 252
4.3.5 时间序列分析应用 . 254
第5 章 给数据披上靓丽“外衣”:数据可视化 259
5.1 数据的可视化 260
5.1.1 数据可视化工具 . 260
5.1.2 常用的统计图 . 261
5.2 条形图、直方图和饼图 262
5.2.1 条形图 . 262
5.2.2 直方图 . 264
5.2.3 饼图 . 266
5.3 线图与面积图 267
5.3.1 线图 . 267
5.3.2 面积图 . 267
5.4 散点图 268
5.5 高低图与箱线图 270
5.5.1 高低图 . 270
5.5.2 箱线图 . 271
5.6 时间序列图 272
5.7 帕累托图 274
5.8 P-P 概率图和Q-Q 概率图 275
5.8.1 P-P 概率图 275
5.8.2 Q-Q 概率图 . 276

本书勘误

印次
  • 页码:9  •  行数:10  •  印次: 1

    1.1.2节中made in China 写成ade in China

    moqiyanruo 提交于 2018/10/15 16:04:05
    王静 确认于 2018/12/4 11:27:05

读者评论

电子书版本

  • Epub

相关图书

微服务容器化开发实战

尹为强 (作者)

微服务和Docker容器技术是目前分布式架构中常用的主流技术,结合Kubernetes强大的容器服务编排与调度能力,中小企业能够简单快速地构建自己的分布式互联网...

¥89.00

Elasticsearch实战与原理解析

牛冬 (作者)

本书基于Elasticsearch 7.X版本编写,内容由浅入深,先教会初学者使用,再介绍背后的原理。 本书共分为三大部分,分别是Elasticsearch前...

 

跟阿达学Tableau数据可视化

优阅达 (作者)

全面介绍了Tableau的核心功能,包括数据连接与编辑、图形展示与编辑功能,如何与R等工具进行集成,如何在服务器上进行发布管理等内容,而且广泛覆盖数据获取与管理...

¥109.00

数据科学实战指南

TalkingData (作者)

本书共分为三部分:第一部分将介绍数据科学工作开始前的必要准备事项,涉及数据安全与数据治理等;第二部分将从人才、数据、工具三个维度指导决策者启动数据科学项目;第三...

 

统计之美:人工智能时代的科学思维

李舰 海恩 罗应婷 姚新军 (作者)

本书每一章节都通过某个历史经典故事、网络热点事件、行业真实案例等背景知识引出对知识点的介绍,涵盖了经典的统计学模型和前沿的数据科学技术,并结合大数据实践领域的经...

¥59.00

大数据浪潮之巅:新技术商业制胜之道

钟韵 (作者)

互联网的迅猛发展产生了海量的数据,海量的数据所蕴含的海量信息则提供了无限的可能。一大批大数据公司应运而生,它们中的一些犹如昙花一现,在快速崛起之后迅速陨落;也有...