业务可视化分析: 从问题到图形的Tableau方法
  • 推荐0
  • 收藏4
  • 浏览1.1K

业务可视化分析: 从问题到图形的Tableau方法

山东客如云信息科技有限公司 (作者) 

  • 书  号:978-7-121-41764-1
  • 出版日期:2021-08-18
  • 页  数:356
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:石倩
纸质版 ¥139.00
对广大的业务分析师而言,业务分析(或者称为商业分析)应该从业务和问题出发,可视化是实现的方法,辅助决策是最终的目的。本书以业务分析为起点,介绍了“样本范围、问题描述和问题答案”的解析方法,以及聚合过程、连续与离散的字段分类,共同作为业务分析、可视化分析的理论基础。
本书借助敏捷BI工具Tableau,详细介绍了7种基本问题类型(排序、时序、占比、文本、分布、相关性、地理)及其对应的基本图形,并介绍了基于标记、坐标轴、参考线、计算的增强分析方法。本书的目的是让读者从“三图一表”的结果分析,经由分布和相关性的特征分析,走向业务分析中的关键领域——多个问题的结构化分析。
以业务分析为起点,“从问题出发”,深刻阐述面向业务的可视化分析框架体系
Tableau Zen Master,Tableau Desktop & Server CA Certification,Tableau培训师和咨询顾问;
山东大学法学学士、教育学硕士,首届研究生国家奖学金获得者(2013);
多次创业者、知识工作者,忠于分享,全心全意服务客户。
自序
赋予可视化灵魂:
基于业务分析的新思考
与笔者的上一本书《数据可视化分析:Tableau 原理与实践》(以下简称《数据可视化分析》)的出版相隔整一年,我们又见面了。感谢每位读者的热心支持,笔者也将付出真诚与所有。这本书不仅仅是过去一年的新知识点,更包括了笔者在数据分析领域挣扎多年后对思考体系的重新梳理和突破。作为《数据可视化分析》的姊妹篇,本书在某些体系上更加基础、完整,在一些知识上又更加深入和进阶。
在这里,笔者简单介绍一下本书的缘起、阐述方法、知识结构等内容。
1.缘起
在《数据可视化分析》一书中,笔者总结多年学习、培训和实施服务的经验,介绍了Tableau的完整知识体系,以及基于Tableau 知识框架的问题分析方法、数据准备的多层模型,特别是基于“层次”(LOD)的计算体系。该书上市后,多谢各位读者的口口相传,在Tableau 的小圈子里流传尚好,而笔者也借加印穿插补充了一些知识要点,并勘误校订。不过,该书的可视化阐述过于简单,这与笔者的艺术感欠缺、知识积累不够有直接关系。
综观各种可视化图形,不管是Tableau Public 上的,还是借助Python 可视化库实现的,在笔者看来,绚烂的形式背后大多远离了数据的土壤——业务环境。可视化的目的是业务与决策,应以业务为背景、从问题出发、以可视化方法辅助决策(见本书第2 章)。
同时,作为Tableau 重要的代理商和服务提供商之一,笔者在过去一年中有幸认识了很多客户,笔者惊奇地发现,原来大公司面临的困境和中小公司其实并无二致,甚至“组织惯性”更大、更难以改变。借助于自己多年前的业务背景,笔者极力向客户推广可视化表象之上的业务探索与结构化分析。在客户服务过程中,寥寥几个“结构化分析”案例总能打动业务人员的心——他们都曾有类似的想法,但是受限于工具,从来没有实现过。
在2020 年下半年给红塔集团、平安普惠等客户提供培训和咨询服务时,笔者就开始酝酿本书的框架。笔者有几个非常明确的期望,希望借助本书实现:
(1)专注业务分析方法,阐述更加完整的逻辑体系,特别是基于“第一字段分类”的问题分析方法、基于层次的结构化分析方法(见第3 章)。
(2)基于“第二字段分类”的可视化逻辑,“可视化是由点线面构成的图形”,但更重要的是图形类型及其对应的业务意义;业务分析是自问题到图形的过程,而非自数据到图形的过程(见第4章)。
(3)从业务场景出发,分门别类介绍问题的类型与图形逻辑,同时引导更多的业务用户从“三图一表”的基本图形,借分布分析和相关性分析的特位分析走向“结构化分析”。结构化分析是本书最重要的归宿,是笔者热切希望每一位读者、用户都能深入理解的内容,借助相关的简单案例,在你的用户中获得“哇喔”的惊喜。
2021 年上半年,在为长隆集团提供咨询服务的过程中,笔者在分享“数据准备与性能优化”时,获得了“第三字段分类”的关键灵感。本书付梓前夕,笔者特意突出了这个内容(见3.4 节),虽然内容简单,但这将是之后新书的主题“数据准备与分析模型”的逻辑起点。
为此,本书尽可能站在业务用户的角度,延续“原理性思考”的底色,阐述如何从问题出发,从业务经验出发,沿着特定的逻辑,掌握业务分析的完整体系和方法。每个人都能经过刻意练习掌握这些方法,之后再与本行业的业务经验结合,成为高级业务分析师。
2.本书的阐述方法
本书的精彩,首先来自体系框架和阐述方式;其次才是工具带来的想象力。
大学毕业及之后多年,笔者跟随王思悦教授学习“发明创造与创新思维”差不多十年了。课程中有一个让笔者铭记一生的例子:带橡皮的铅笔与羊角锤。王教授精彩地阐述了如何通过“同中之异”“异中之同”的角度创造性地总结多个事物背后的特征,从而让笔者迈向创新之路。带橡皮的铅笔一端能写、一端能擦,羊角锤一端能敲、一端可拔,功能相克,这是二者的“异中之同”。而二者又有显著的差异,前者是“材料上的互克”,后者却是“结构上的互克”,此为“同中之异”。这个例子笔者反复听了很多年,每次都有新的收获,如今终于可以换一种方式表达出来。
在本书中,笔者将用上述思考方法,总结多年业务分析和客户服务经验中的“同中之异”和“异中之同”,构建整本书的逻辑体系,比如:
? Excel 透视图、SQL 聚合查询、Tableau 拖曳分析之间的相同点是什么(问题的结构和聚合过程是相同的,见第2 章)?不同点又是什么(展现方式不同,即可视化基础,见第3 章)?__
? 条形图、折线图、饼图作为简单图形背后的相同点是什么(结果分析为主)?分布分析和相关性分析的相同点又是什么(特征分析为主)?从结果分析、特征分析再往前,就是二者结合的结构化分析。
? 简单问题和复杂问题因何不同,又因何关联在一起?如何用逻辑方法构建复杂问题和高级问题的结构?层次是问题分析的关键,多个层次的相关性就是结构化分析的关键。
以上是本书暗含的脉络。经由“同中之异”“异中之同”的普适性原理与方法,帮助所有人快速进入可视化业务分析的广阔天地,再根据问题的不同类型,阐述不同分支的前进之路。
这种构建方法的好处是能在案例之后直抵原理,帮助读者举一反三、触类旁通,从而成为高级的业务分析师;而其缺点就是需要一定的理解能力,毕竟这也是笔者十年之功,历经多个行业的点滴总结。
当然,在看似复杂的体系背后,笔者并没有重新创造什么知识,无非是采纳百家之长,然后组合创新的结果(就像克里斯坦森所言)。五音可以谱曲,五色创造绚烂,哪怕只有五种图形,借助于原理性的理解和业务的表述方法,也可以深刻地展示数据背后的业务规律。
“图片最伟大的价值在于它迫使我们注意到从未预见到的事物。”
——《探索性数据分析》,1998
在这个过程中,业务问题是指引,是方向,是北斗星。有一个“因指见月”的典故,教导我们不能执着于名相(“手指”)而忘记了修行的觉悟(“月亮”),就像匆忙得只记得赚钱而忘记了生活。业务分析何尝不是如此?
3.本书的知识结构
本书从业务出发,从问题出发,穿插必要的分析知识和图形概念,最后以高级分析结尾。其中重点解释业务分析方法、可视化构建方法、主要的问题类型与扩展逻辑、业务中的结构化分析方法等,具体如下。
第1 篇,介绍业务分析的重要性,以及问题分析的方法与可视化分析基础。
第1 章,通过一个小故事,介绍传统企业普遍面临的困境。
第 2 章,介绍数据分析如何成为连接数据资产到价值决策的桥梁。这个桥梁中有两个关键词:问题和图形。问题决定图形的类型与意义,图形是问题的载体。基本可视化、交互探索可视化和结构化分析层层递进,越来越靠近业务的本质。
第3 章,介绍问题分析的方法。介绍适用于所有行业、普遍场景的结构化问题思考方法、过程思考方法,并努力将一些技术领域的专业词汇变成普及型的业务知识。
第4 章,介绍可视化分析的构建逻辑与通用方法。脱离具体的图形,介绍可视化的构成、字段属性、图形的逻辑意义,以及适用于每种图形的可视化绘制路径和方向。
第2 篇,介绍可视化分析的常见图形及其业务延伸形式。
第5 章,介绍本书“从问题到图形的方法”的思考来源,以及主流的几种可视化选择路径。第6 章~第12 章,分别介绍排序与对比、时间序列、占比、文本表、分布分析、相关性分析、地理空间可视化共7 个主要的问题类型,以及每一类问题对应的基本图形、复杂图形和高级图形样式。
第3 篇,介绍从单一可视化分析走向高级分析的交互与结构化分析。
第13 章,介绍“样本范围”相关的控制要素,并重点介绍在“样本范围”中引用另一个层次的问题分析。以购物篮关联分析为例,对比了筛选、集和计算3 种实现方法。
第14 章,本书最重要的升华,介绍了“结构化分析”的业务背景、问题类型、典型案例,以及与之相反的可视化方向。
第15 章,分享了如何成为一名优秀的业务分析师(商业分析师)的个人经验和建议。
在各个章节中,穿插了业务分析的案例和思考方法,限于篇幅,不能完整介绍每一步的细节,需要读者在“技艺”方面多加练习和探索。
卓越的思考一定是超越工具的,但最好的思考只有在最佳的工具中才能尽情绽放。本书配图主要基于Tableau Desktop 完成,部分环节辅以Excel 与SQL 作为对比理解。
4.本书的长远希望
“业务分析师”或“商业分析师”作为一个全新的职业,在互联网、电商等行业中越来越重要;而每一个传统行业,都值得用类似的思维重建对数据的理解和数据分析框架——正如很多人所说,“数字化时代,所有的行业都值得重做一遍”,不管是卖菜、水电公共事业,还是制造汽车、火箭,这是我们这一代人的幸运和机会。很多传统公司在犹豫是否购买哪怕一套Tableau 时,它已经为此付费了(只是换一种方式,比如重复劳动、沉没成本等)。
在这个快速变化的时代,很多人被守旧的思维和工具所困,所以“忙而无功”;很多IT 部门陷入“终日碌碌”,而业务部门依然觉得他们“无所作为”的困境——不是每个人不努力,只是他们在做不擅长的事情。笔者希望为乐意改变的个人和单位提供一条看得见的转型之路。基于可视化分析的业务分析,是适用于任何企业的“数字化转型”的窗口。__
数据是资产,已经是无可置疑的了,因为数据被称为“21 世纪的石油”。
如果有人希望从IT 人员转型为业务分析师(商业分析师),如果有人希望从业务人员成长为更优秀的业务经理(跨界的业务经理),那么笔者希望这本书能提供给他们一些捷径,并减少笔者所经历的苦痛和纠结。业务分析首先应该关注思维方法,其次才是工具实现。
不管你是否在用Tableau,本书都将提供超越软件本身的灵感。借此,希望读者能找到适合自己的成长之路。
毕竟,作为新时代的从业者,我们不仅仅是公司中的一员、家庭中的一员,更重要的是“自己的CEO”,正如德鲁克所言:
“知识工作者必须成为自己的首席执行官……不仅要清楚自己的优点和缺点,也知道自己是怎样学习新知识和与别人共事的,并且还明白自己的价值观是什么、自己又能在哪些方面做出最大贡献。
因为只有当所有的工作都从自己的长处着眼时,你才能真正做到卓尔不群。”
5.鸣谢
本书的构想最早源自红塔集团玉溪卷烟厂高宇雷先生的提议,他建议笔者多分享一些“可视化的制作方法”;之后在给平安普惠的多次培训中,本书脉络逐步完善,并在2021 年春节期间集中完成。
2021 年4 月,为了验证本书的逻辑框架,笔者又在上海组织了6 天的课程,完整、深入地分享
了本书的细节,并获得了一些宝贵的改进线索。感谢参与的每一位朋友,以及来自上海杉达学院(提供了活动场地)、上海交通大学、华东师范大学、上海对外经贸大学等多位老师和学生的聆听。
感谢多年来每一位客户的支持和理解,作为一名“创业型知识分子”,客户给了笔者最大的理解和支持,这是笔者成长的土壤,也是这本书创作的动力。特别感谢百胜中国唐小强先生为本书做出的贡献,他是完整阅读本书的首位读者。
感谢Tableau,它让笔者感受到了“文思泉涌”的激情和热爱。2021 年有幸成为全球Tableau ZenMaster 的一员,让笔者倍感荣幸。这本书也是笔者对这项荣誉的最好回馈。虽然本书在努力脱离工具阐述分析方法,但在Tableau 面前,笔者永远要保持谦逊——笔者只是一具传递知识的“皮囊”,而Tableau 才是激活笔者力量、赋予笔者能量的宝剑。
感谢多位Tableau 大师,特别是Ken Flerlage、Andy Kriebel、Alexander Mou 、Jeffrey Shaffer 等多位Tableau Zen Master,读者可以在Tableau Public 上领略他们的绝佳作品,本书多有引用。
感谢与笔者同时入围Tableau Zen Master,同时还是中国首位Tableau Ambassador 的Wendy(汪士佳)女士;笔者诚邀Wendy 为本书设计封面,她的回馈远超笔者的预期。不管是笔者所代表的理性之路,还是Wendy 所代表的艺术家之路,Tableau 都会是你最好的伙伴。
感谢电子工业出版社的石倩编辑,因缘际会合作至今,她是两本书背后的默默功臣;每次图书加印,她都耐心地让笔者的书更加完美——不管是修改错别字、升级插图,还是协助笔者重写某些章节。本书的未来也是如此,每一次加印,都是一次或大或小的升级,这也是我们对待知识的态度。
感谢家人,在笔者匆匆忙忙的人生路上,他们理解了笔者的一切。
感谢喜乐的人生;人生美好。

目录

第1 篇 从业务和问题出发的可视化体系
第1 章 我的故事:业务分析需要可视化 2
1.1 生活/工作面前,我们都一样 . 2
1.2 带着问题启程 6
第2 章 奠基:业务可视化分析的价值 . 7
2.1 古往今来,分析的终极目的是辅助决策 7
2.2 决策:获得信息、做出判断 10
2.3 简单可视化:帮助领导更快地获得信息 11
2.4 交互可视化:可视化是假设验证的工具 14
2.5 高级可视化:分布、相关性分析与结构化分析 16
2.6 Tableau:敏捷BI 助力决策分析 18
第3 章 地平线:问题分析的方法与数据基础 . 20
3.1 问题的结构化分析与“第一字段分类” 21
3.2 分析的动态过程:聚合是本质 23
3.2.1 Excel 数据透视表:拖曳即聚合 23
3.2.2 SQL 的聚合查询:窗口式查询 24
3.2.3 Tableau VizQL 可视化聚合查询 . 26
3.3 行级别明细数据是聚合的起点,是分析的原料 27
3.3.1 数据表中包含的数据常识:数据类型与分类 . 27
3.3.2 理解数据表行级别的业务逻辑及其唯一性 . 34
3.3.3 聚合度是以数据表行级别为基准点的、衡量问题层次高低的尺度 . 37
3.4 直接聚合:基于行级别的直接聚合类型 40
3.4.1 描述规模:总和、平均值、计数 . 40
3.4.2 描述数据的波动程度:方差和标准差 . 41
3.4.3 关注个体、走向分布:百分位函数及最大值、最小值、中位数 . 44
3.5 从数据到问题的关键:“第三字段分类” 47
3.5.1 第三字段分类:行级别计算与聚合计算 . 47
3.5.2 理解聚合计算中的典型代表:“比值聚合” . 49
3.6 间接聚合:基于视图聚合的二次聚合 50
3.6.1 “复杂问题”的两个方向特征 . 50
3.6.2 基于直接聚合的二次聚合:大数据的OLAP 分析 51
3.7 从问题分析视角看数据分析的发展阶段 57
3.7.1 小数据时代的多角度明细展示 . 57
3.7.2 数据统计时代的聚合汇总 57
3.7.3 大数据时代的结构化分析 58
第4 章 启程:可视化构建方法与扩展路径 60
4.1 从聚合到图形:第二字段分类与图形构成要素 60
4.1.1 可视化坐标空间:坐标系与坐标轴 . 62
4.1.2 “第二字段分类”与坐标轴. 63
4.1.3 可视化视觉模式与图形类型. 70
4.1.4 可视化的意义描述 74
4.2 7 种主要的问题类型及其主要图形 . 75
4.2.1 传统三大图及其局限性 76
4.2.2 文本表:侧重度量指标的高密度展现 . 78
4.2.3 分布分析的三大典型图形 78
4.2.4 相关性:散点图与双轴折线图 . 82
4.2.5 地理位置可视化 83
4.3 从基本问题类型到复杂图形的延伸方法综述 85
4.3.1 从问题分析到图形增强分析的完整路径 . 85
4.3.2 基于行列的空间扩展:分区与矩阵 . 86
4.3.3 基于标记的增强分析:分层绘制方法 . 89
4.3.4 基于坐标轴的扩展:双轴、同步与多轴的合并处理 . 96
4.3.5 基于参考线的扩展:增加视图聚合的二次聚合 . 97
第2 篇 问题的7 种基本类型与可视化方法
第5 章 从问题到图形的可视化逻辑 . 102
5.1 从问题到图形的启蒙与进化 102
5.1.1 《用图表说话》中的三步走方法 . 102
5.1.2 “问题的字段解析方法”与基本问题类型 . 103
5.2 可视化图形分类方法与可视化过程 105
5.2.1 FT 可视化词典 . 105
5.2.2 Data Points 中的数据可视化过程 107
5.2.3 Abela 的“图形推荐”逻辑 108
5.2.4 面向IT 的Echarts 分类与Tableau . 109
第6 章 排序与对比(部分与部分) . 111
6.1 基本条形图与多个离散维度条形图 111
6.1.1 并排条形图(side-by-side bar):离散字段并排构成分区 . 112
6.1.2 条形图矩阵:离散字段交叉构成矩阵 . 113
6.1.3 矩阵实例:日历矩阵条形图. 114
6.1.4 堆叠条形图:你喜欢喝什么咖啡 . 116
6.1.5 比例条形图:把堆叠条形图转化为占比分析 . 118
6.2 包含多个度量坐标轴的条形图 119
6.2.1 字段重要性递减的多种布局方式 . 119
6.2.2 考虑字段关系的双轴布局方式 . 120
6.2.3 并排条形图:多个绝对值度量字段的对比 . 122
6.2.4 重叠条形图:多个绝对值度量字段的包含关系 . 124
6.3 字段类型和属性对可视化的影响 125
6.3.1 字段类型和属性对颜色的影响 . 125
6.3.2 “绝对值”与比值:字段属性对标记选择的影响 . 127
6.4 坐标轴的调整与组合 128
6.4.1 默认零点:除非必要,谨慎更改 . 129
6.4.2 坐标轴“倒序”:有些数据越大越差 . 129
6.4.3 绝对值刻度与百分位刻度 130
6.4.4 从“等距坐标轴”到“不等距坐标轴” . 131
6.4.5 棒棒糖图:虚拟双轴 132
6.5 以条形图为底色的进阶与高级图形 133
6.5.1 靶心图:在排序基础上增加对比关系 . 133
6.5.2 “进度条”:展示单一对比关系的条形图变种 . 135
6.5.3 结构化分析实例:条形图的“高级化” . 138
第7 章 时间序列与序列相关性 140
7.1 时间序列的构成 140
7.2 折线图的多种延伸形式 141
7.2.1 时间的层次与连续/离散属性 . 141
7.2.2 并排折线图和矩阵折线图 143
7.2.4 多维度折线图、堆叠面积图、百分比堆叠面积图 . 144
7.2.3 包含时序的柱状图与结构化分析 . 147
7.3 包含多个度量的时间序列 149
7.3.1 时间序列中的双轴与柱状图. 149
7.3.2 双轴的改变:柱状图与折线图的结合 . 150
7.3.3 基于公共基准的多轴合并 151
7.4 时间序列与条形图的结合:甘特图及其变种 152
7.4.1 标准甘特图:沿着连续日期延伸 . 152
7.4.2 股票蜡烛图:两个甘特图的重叠 . 154
7.4.3 跨度图:“伪装的甘特图样式” . 155
7.4.4 阶梯图:以阶梯方式表达“跨度” . 157
7.5 日期的高级转化:绝对日期与相对日期 159
7.5.1 原理:何为绝对和相对时间轴 . 159
7.5.2 “公共基准”案例:产品在不同时间段的业绩对比 . 160
7.5.3 “公共基准”案例:客户复购分析 . 163
7.6 时序分析中度量的处理与高级图形 166
7.6.1 聚合度量的累计汇总处理 166
7.6.2 绝对值与同比双轴图:同比或环比的比率 . 167
7.6.3 排序图:绝对值转化为相对排序 . 168
7.6.4 高级案例:地平线图——借助高级计算处理度量 . 170
7.7 坡面图:次序字段的前后变化 174
7.8 在趋势中增加对比关系:双折线增加阴影区 175
第8 章 占比(部分与总体占比) . 179
8.1 占比问题类型与饼图 179
8.2 树状图:占比与层次关系 181
8.3 初级:饼图作为辅助图形查看结构 184
8.4 中级:结合计算自定义分组及其占比 186
8.4.1 行级别分组:使用组和行级别计算自定义分组 . 186
8.4.2 特定层次的分组:使用集和高级计算动态分组 . 187
8.5 中级:使用多种方法展示类别的占比 189
8.5.1 方法一:使用“隐藏”功能分析单一类别占比 . 189
8.5.2 方法二:使用“行级别计算”分析单一类别占比 . 190
8.5.3 方法三:使用“筛选和高级计算”分析单一类别占比 . 191
8.6 高级图形:环形图、旭日图、南丁格尔玫瑰图 192
8.6.1 环形图:最简单的双层次结构 . 192
8.6.2 旭日图:双层占比 193
8.6.3 南丁格尔玫瑰图及个人建议. 194
第9 章 文本表及其延伸形式 196
9.1 文本表的关键场景:最高聚合与“总分结构” 196
9.2 交叉表的优势与推荐场景 198
9.3 让交叉表更实用:增加可视化修饰的方法 200
9.3.1 典型交叉表的样式与说明 200
9.3.2 简易法:基于度量名称的颜色修饰 . 201
9.3.3 简易法:基于单一度量的突出显示表 . 203
9.3.4 高级法:基于坐标轴和标记的“文本自定义” . 204
9.3.5 高级法:使用自定义字段逻辑控制形状或其他 . 208
9.4 让简单丰富起来:善用工具提示与仪表板互动 209
9.5 文字云与气泡图:不常使用和不推荐的图形 211
9.6 总结:用好“三图一表”,展开业务面纱 212
第10 章 大数据的关键:超越个体、走向分布 . 214
10.1 从个体分析到分布分析 214
10.2 直方图:分布分析第一图 215
10.2.1 简单直方图:使用数据桶(bin)在数据表行级别创建直方图 216
10.2.2 高级直方图:使用高级聚合计算和数据桶生成直方图区间 . 217
10.2.3 基于RFM 模型的客户分布分析 219
10.3 箱线图:离散分布与异常发现 221
10.4 帕累托图:特殊的头部集中分布 222
10.4.1 横轴百分位处理:将离散维度序列转化为连续百分位坐标轴 . 224
10.4.2 纵轴累计百分比处理:连续度量的百分位转化 . 224
10.4.3 空间分类处理:帕累托图的颜色分类和互动筛选 . 225
10.5 自定义分布分析:参考线与参考分布模型 227
10.5.1 使用多条“百分比”参考线构建区间 . 228
10.5.2 自定义百分位分布区间 229
10.5.3 分位数分布区间 230
10.5.4 标准差分布与“质量控制图”和“六西格玛区间” . 230
第11 章 超越经验,走向探索:广义相关性分析 . 234
11.1 散点图与参考分区:波士顿矩阵 234
11.2 中级:散点图矩阵和“散点图松散化” 237
11.3 高级:用皮尔逊系数生成相关值矩阵 241
11.4 层次关系:多个维度字段之间的结构关系. 244
11.5 次序字段的流向分析:漏斗图和桑基图 247
11.5.1 漏斗图(上):基于次序字段的变化 . 247
11.5.2 漏斗图(下):基于度量值的变化 . 250
11.5.3 桑基图:多阶段的流向变化(简要) . 252
11.6 瀑布图:多个数值的依赖关系 253
11.7 雷达图:多角度的综合关系 256
11.8 相关性或因果关系:基于空间的流行病学案例 . 259
第12 章 特殊的分布:地理空间分析 . 264
12.1 地理空间和地理图层 264
12.2 点图与热力图:地理空间分布 265
12.3 符号地图与填充地图 267
12.4 自定义地理空间与空间矩阵 270
12.4.1 为数据点增加缓冲区 270
12.4.2 自定义地理空间:“化学元素周期表” . 271
12.4.3 高级案例:使用表计算自定义空间矩阵 . 272
12.5 路径地图:两种数据结构,两种绘制方式 274
12.6 地理空间图形的说明 275
第3 篇 超越:从可视化分析走向结构化洞察
第13 章 样本控制与假设验证:交互 . 279
13.1 在Excel、SQL、Tableau 中构建分析样本 . 279
13.1.1 Excel 与SQL 中的静态筛选 . 279
13.1.2 在Tableau 中创建筛选的基本方法 281
13.2 样本控制的形式与归类 282
13.2.1 快速筛选器的常见形式与优先级 . 282
13.2.2 关联筛选器和共用筛选器 285
13.3 基于中间变量的高级样本控制 286
13.4 样本控制的高级形式:指定层次的条件筛选 289
13.4.1 指定层次条件筛选的3 种方式 . 289
13.4.2 购物篮关联分析的样本解读——量化筛选条件 . 290
13.5 性能:逻辑计算位置对筛选的影响 293
13.5.1 筛选的本质与筛选的标准位置 . 293
13.5.2 在聚合过程中间接筛选的“非标准操作”及其代价 . 295
13.5.3 不同筛选方法的高级分类与适用场景 . 296
第14 章 从表象到本质:结构化分析是业务可视化分析的灵魂 . 299
14.1 结构化分析是通往业务探索的必由之路 299
14.1.1 结构化分析是业务复杂性的要求 . 300
14.1.2 结构化分析的基本形式 301
14.2 可视化分析中常见的层次及其组合关系 303
14.2.1 行级别层次、问题层次及聚合度 . 303
14.2.2 结构化分析的基本类型 305
14.3 结构化分析的几种典型场景和案例 305
14.3.1 交易的利润结构分析:主视图引入行级别层次的聚合 . 305
14.3.2 客户的利润结构分析:主视图引入更低层次的聚合 . 307
14.3.3 客户矩阵分析:当前视图层次引入独立层次的聚合 . 309
14.3.4 环形图:当前视图层次引入更高聚合度层次的聚合 . 310
14.4 结构化分析的高级形式:嵌套LOD 的多遍聚合 313
14.4.1 客户购买力:使用嵌套LOD 完成多遍聚合 . 313
14.5 通用的层次分析方法 316
14.5.1 结构化分析与“问题结构” . 316
14.5.2 层次分析的4 个步骤 317
14.6 和结构化分析相反的“努力”方法 318
14.6.1 “形式大于内容”的图形 318
14.6.2 缺乏代表性和意义的指标 321
14.6.3 缺乏互动性的图表 321
14.6.4 不符合直觉的设计 322
第15 章 归来:成为优秀的业务分析师的个人建议 . 323
15.1 好奇、探索和持续学习的欲望,是前进的源泉 323
15.2 学习理解原理,方能举一反三、事半功倍 324
15.3 深入理解业务,方能立于不败之地 325
15.4 分析要从明细开始,过度整理会远离真相 326
15.6 循序渐进,不要好高骛远 328
后记&参考资料 . 330

读者评论

相关图书

Python数据可视化之美

张杰 (作者)

本书主要介绍如何使用Python 中的matplotlib、Seaborn、plotnine、Basemap 等包绘制专业图表。本书首先介绍Python 语言编...

¥90.30

Python数据可视化之matplotlib实践

刘大成 (作者)

本书借助Matplotlib讲解开展Python数据可视化实践所需要掌握的关键知识和技能。本书主要由Matplotlib入门、精进、演练和拓展四部分组成。同时,...

¥29.00

Meteor全栈开发

杜亦舒 (作者)

本书全面介绍了新一代全栈开发平台 Meteor。书中首先简要介绍了 Meteor 的概念和特性,然后通过各种示例讲解 Meteor 的用法,再用案例实践的方式综...

¥48.00

前端函数式攻城指南

欧阳继超 (作者)

在后端,函数式语言层出不穷。在前端,函数式最后的边界也已经被渐渐打破。Scala的Scala.js、Clojure的ClojureScript都试图同构移向前端...

¥39.00

Egret——HTML5游戏开发指南

张鑫磊 (作者)

本书向大家介绍HTML5游戏行业最新动态以及未来发展方向,同时也提及了当前HTML5技术相关市场。全书针对Egret HTML5游戏做了全方位讲解,涉及游戏中的...

¥65.00

ES6 标准入门(第2版)

阮一峰 (作者)

ES6(又名 ES2105)是 JavaScript 语言的新标准,2015 年 6 月正式发布后,得到了迅速推广,是目前业界超级活跃的计算机语言。本书是国内仅...

¥49.00