数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。
本书系统地介绍了数据分析的统计理论基础内容,共5章。第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析内容,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形的功能及使用场景。
本书以数据分析的统计理论基础为主题,大多数知识点都列举了生活中的实用案例,适合高等院校学生、公司职员、个体商户和企业管理者学习参考。
帮助读者建立统计理论知识框架,形成数据分析思维逻辑,学会数据分析方法
前言
人人都应该会数据分析
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员、个体商户、大公司管理者都需要有数据分析的能力。很多人认为数据分析能力就是对数据进行描述和做出漂亮统计图形的能力,这是狭隘的理解。数据分析能力的基础在与数据分析的逻辑思维能力,而逻辑思维能力的培养必须建立在统计理论基础之上。
统计学是数据分析的基础
在移动互联网时代,信息的获取成本越来越低,这也导致拿来主义和实用主义盛行。数据分析科学是一门需要紧密联系生活实际的科学。数据分析方法非常多,这是因为不同的数据分析环境需要选择不同的数据分析方法来处理,因此在数据和数据分析方法之间,天然地存在鸿沟,拿来主义和实用主义经常行不通,而磨平鸿沟的方法就是学习统计理论基础。
笔者接触过很多希望学习数据分析或正在学习数据分析的朋友,发现他们身上都有一个通病,就是将学习各种分析软件作为学习重点,觉得学习数据分析就是学习分析软件操作。他们在进行具体数据分析时,通常的做法是套用别人的数据分析逻辑和方法,如果分析结果与参考结果一致,那么没有问题,但是通常的情况是不一致,这时他们就需要浪费大量的时间和精力查找原因。而不一致的原因通常是数据情况不符合导致的,解决的办法是根据实际的数据分析环境进行数据调整或选择其他合适的数据分析方法,而要做到这些,归根结底需要的还是扎实的统计理论基础。
学习数据分析应该以统计理论基础为主线,分析软件仅仅是各种分析方法的实现工具,因此在开始学习时,应该附以一到两种操作简便的分析软件,例如SPSS。这样就能够比较快速地建立统计理论框架,并掌握一款分析软件。当你的统计理论基础夯打扎实以后,会发现学习各种分析软件都能够游刃有余,甚至像R和Python这种需要编程语言的软件也能在比较短的时间内掌握。
从生活案例开始学统计学
标准版的统计教材往往偏重于理论推导,描述语言专业严谨,这不可避免地带来了晦涩难懂的问题。本书的写作初衷就是为了解决没有任何统计基础的各行各业的数据分析学习者,他们学习和构建自己统计理论基础的需求,大部分知识点都列举了生活中的应用案例,能够帮助学习者更好地理解和掌握各个知识点的分析逻辑,并内化为自己的统计理论基础的知识框架。
除此之外,本书在章节设计上做了精心的安排,共包括5章。
第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径。
第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据。
第3章为推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征。
第4章为预测分析内容,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,过去的历史数据信息预测未来可能出现的数据信息。
第5章是数据结果可视化的内容,包括了各种统计图形的功能及使用场景。
“不积跬步,无以至千里”,夯打基础的过程总是比较乏味痛苦的,希望本书通俗的描述语言和鲜活的生活应用案例能够帮助数据分析学习者顺利的建立统计理论知识框架,形成数据分析思维逻辑,成为各自领域的佼佼者。
1.1.2节中made in China 写成ade in China