面向数据分析师的数据可视化指南
  • 推荐0
  • 收藏2
  • 浏览288

面向数据分析师的数据可视化指南

林斌 (作者) 

  • 丛  书:大数据丛书
  • 书  号:978-7-121-36893-6
  • 出版日期:2020-05-25
  • 页  数:232
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:刘皎
纸质版 ¥99.00
本书针对数据分析和研究报告中的图表应用,结合大量经济、金融和商业实例,探讨数据可视化的基本原则、技巧及思路。本书基于Excel软件,循序渐进地介绍专业图表制作的技术准备、图表元素的增强控制、不同类型数据的可视化方案,以及研究报告中常用的数据转换及分析技术。
本书旨在帮助拓展商业和金融数据的可视化表达思路和方法,提升报告品质,也适合即将从事数据分析相关工作的学生及对数据可视化感兴趣的读者阅读。
案例丰富,事半功倍
配套讲解视频和丰富的案例资源
全彩印刷,图例清晰生动
前言

作为一种沟通界面和表达方式,可视化常被归入输出环节。数据和观点经由图表展现,从而提升阅读者对数据的感知或观点的说服力。事实上,视觉表达在数据探索阶段也能够高效率地发挥有助于信号过滤、搜索和促进判断的重要作用。因此,可视化的重要性可见一斑。
提升数据可视化水平无非二途:或求诸于图表,或求诸于数据。前者着眼于图表层面的优化和改进,后者则探求数据内涵、突出数据重点。描述性数据似乎侧重于前者,探索性数据则更依赖于后者,但事实未必如此。本书将用大量实例表明,二者的关系相得益彰。
在图表层面,本书在格式及外观设计方面着墨不多,原因来自两个方面。首先,本书内容侧重于分析和研报应用,数据处理和表达较配色、字体、字号、布局等设计因素无疑更为重要。以颜色为例,除去显而易见的文化和习俗因素、冷暖色调的心理影响、强弱明暗的显隐效应,剩余大多是瞬息多变的时尚及观感差异。其次,正如更好的配色难以解决颜色太多的问题,在绘图系列单一、数据点数量有限的前提下,除“改头换面”所带来的短暂新鲜感外,使用何种设计多数时候并无大碍,要紧之处在于随着绘图系列和数据点的不断增加,摆脱视觉限制乃至视觉陷阱,为数据可视化之重点。
图表层面的另一个常见误区是在数据关系和图表类型之间建立起僵化的一一对应关系。初学者会很自然地被此类对应关系所吸引,但本书会用大量实例说明,分析师在考虑数据可视化表达之前,无须也不应受此对应关系的约束。使用何种图表类型表达数据因人而异,也因期望表达的数据侧重点而异,在许多时候图表类型的选择受数据样本规模的影响更大。
学习即连接,缺乏连接的知识记忆转瞬即逝。图表可视化是一项实务技能,最有效的学习方法是通过读者所在的专业领域、数据内容和术语学习图表。本书面向金融、财经及商业分析领域从事决策支持工作,尤其是需要制作研究报告的各类专业人士,旨在帮助拓展商业和金融数据的可视化表达思路和方法,提升报告品质。本书所有实例都经过精心挑选,在数据及处理、制作技术及表达方法等方面具有一定特色和挑战,笔者希望这些实例能让读者建立知识连接、受到启发以提高学习效率。
除非特别说明,本书实例使用Excel 2013电子表格软件制作,所有图表均通过手工操作完成,未涉及宏及自动化应用。笔者假定读者已具备一定的图表制作经验,熟悉Excel图表的主要类型,能够进行与格式化相关的基本操作。本书第2章提供了精简的图表操作快速入门要点,不具备预备知识的读者应在全面掌握第2章内容之后,再阅读后续章节。技术图书难免步骤堆砌,阅读和消化这些步骤所需的专注和忍耐力常令许多入门用户有始无终。与此同时,过度关注细节难免占用归纳总结等高级思维所需的心智资源,甚至有碍记忆。为淡化步骤式学习,本书尝试在结构和内容设计方面有所取舍,例如将具体步骤按性质适当归类合并,减少外观格式化相关设置,同时对较为基础、未在正文中详细介绍的操作细节,有选择地以备注形式单独进行说明,以使正文和备注内容相互补充,满足不同层次的读者需求。
图表的背后是数据,哪怕是貌似权威无误的数据实际上也不能完全免于主观。本书实例仅作为讲解图表可视化及数据处理技巧之用,笔者不能保证所引数据的完整、客观和准确,更无任何图表能反映笔者的观点、立场和倾向。笔者强调研报图表可视化的重心在数据上,而阅读书中实例却要专注于图表及数据处理技术而非数据自身。
受笔者经验和时间所限,本书实例并不代表最佳实践,也未必是最佳表现方式,错误和遗漏在所难免,如有任何疑问或反馈,请与我联系。
致谢
本书从图书立项、审稿、文字编辑到后期设计,凝聚了许多人的劳动成果。我感激他们的付出,对他们表现出的开放精神和专业素质充满敬意。编辑刘皎给我很多帮助。在创作过程中,刘皎女士就本书定位、结构和内容编排方面提出过许多中肯意见,我从中受益良多并欣然采纳了她的大部分建议。
本书是在较长一段时间内断续写就的,期间收到许多朋友和学员的咨询和反馈,这些交流常给我激励,也是书中部分实例的灵感来源。
我将这本书献给秦怡,感谢她不变的爱与支持。

目录

第1章 理解图表 1
1.1 图表的力量 1
1.2 WHERE问题:坐标轴平面 3
1.3 WHAT问题:图表的视觉机制 3
图形对象和视觉属性 3
视觉机制和前注意过程 6
理解视觉属性的边界 8
可视化的本质 9
1.4 WHY问题:数据和图表的意义 11
1.5 小结 13
第2章 快速入门指南和技术准备 14
2.1 快速入门指南 14
理解数据系列 14
快速添加数据系列 16
快速追加数据点 18
复制系列 19
更改图表类型 19
2.2 技术准备:坐标轴 20
数值、文本及日期 21
主/次坐标系 23
2.3 技术准备:图表中的(X,Y)坐标 26
分类轴为数值类型 26
分类轴为文本类型 27
分类轴为日期类型 29
2.4 技术准备:误差线 30
启用误差线 30
误差线的方向和图表类型 30
误差线的正、负方向 32
误差量和线段长度 33
2.5 小结 34
第3章 图表元素的增强控制 35
3.1 图例 36
实例1:部分城市CFA持证人数量 36
实例2:美国对中国进口产品的依赖度和关税 40
3.2 事件注释和数据点标记 44
实例3:布伦特原油价格走势 44
实例4:诺贝尔奖历年累计获奖人数 47
3.3 独立存在的刻度线 52
实例5:GDP增长率 vs. 股市年化回报率(2000—2016年) 52
实例6:为诺贝尔奖实例创建刻度线 56
3.4 不等距的网格线 56
实例7:美国国债收益率曲线 57
3.5 数值参考线和分隔线 59
实例8:最低工资及GDP占比 61
实例9:中国劳动生产率增速 64
实例10:全国主要城市房价和租金 68
3.6 阴影背景 71
实例11:美国人均烟草、酒精及冰淇淋消费量 71
3.7 其他面积元素* 77
实例12:全球股市估值矩阵 77
实例13:入境游客国籍和性别 83
3.8 小结 86
第4章 变动和趋势 88
4.1 常规图表分析 88
折线图 88
柱(条)形图 89
4.2 两个时间点的数据变动 91
实例1:A股行业板块市值的变动 92
实例2:部分省(市)最低工资的变动* 99
4.3 配对变量的变动 102
两个时间点的数据变动:配对散点图 102
实例3:美国对进口商品的征税比例及平均税率 104
配对变量的时间序列变动 107
实例4:中美服务业对比 108
4.4 季节性变动 110
4.5 面板图:多系列的空间分离 111
实例5:2011—2017年国内啤酒月产量 113
实例6:2005—2017年部分自主品牌汽车市场份额变化 117
4.6 热力图:用颜色表达变动特征 119
4.7 小结 120
第5章 比较、分布和构成 122
5.1 比较:定义及常规图表选择 122
5.2 双变量对比 123
5.3 三个变量及更多变量的对比 126
实例1:部分国家核能比较 127
实例2:部分省市低保人口比例 * 129
5.4 分组对比 133
实例3:海洋捕捞占比及人均鱼肉年消费量 134
实例4:轻重资产和市销率估值对比 136
5.5 多维比较 139
实例5:A股市场表现风格 141
5.6 分布的可视化:描述统计 144
实例6:上市公司从成立到IPO的年数分布 145
实例7:A股部分行业历史估值分布 148
实例8:部分行业资产负债率分布对比 152
5.7 分布的可视化:展示样本全貌 155
实例9:上证指数涨跌幅 156
5.8 局部和整体 158
实例10:各行业市值占比及境外营收占比 160
5.9 小结 164
第6章 探索数据关系 166
6.1 散点图简介 166
6.2 反映相关关系 167
折线叠加 167
散点图 169
对比分析 170
6.3 散点图中的拟合模型 172
图表趋势线简介 172
图表趋势线的生成和设置 173
趋势线实例 175
实例1:城镇化水平和低保人口比例 177
6.4 第三个变量:散点图中的分组处理 180
实例2:人均GDP和汽车品牌偏好 181
实例3:长、短期国债息差的结构变化 183
6.5 小结 186
第7章 数据转换和分析技术 188
7.1 概述 188
7.2 基于图表的数据转换 189
坐标轴逆序 189
对数刻度 191
平滑处理 193
叠加和平移 195
7.3 衡量相对关系 198
比率分析 198
偏离值 199
滚动相关分析 200
滚动回归 202
7.4 刻度重置 204
相对和绝对 205
指数化 207
排名 209
百分位 210
标准分数 212
7.5 事件分析 214
跟踪事件后的市场表现 216
事件前后对比 216
从一个事件到另一个事件 218
7.6 简要的函数介绍 219
7.7 小结 219
第8章 数据可视化进阶指南 221
图表制作技巧 221
图表类型选择 222
数据转换处理 222

读者评论

同系列书

  • 企业数据化管理变革——数据治理与统筹方案

    赵兴峰 (作者)

    很多企业热衷于谈论大数据,却忽视企业内部的基础数据管理以及内部管理团队的数据思维训练。不重视数据,就不会有数据;没有数据、没有具备数据思维的管理团队,大数据跟你...

    ¥59.00
  • 解析深度学习:语音识别实践

    俞凯等 俞栋 邓力 (作者) 俞凯 (译者)

    本书是首部介绍语音识别中深度学习技术细节的专著。全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用...

    ¥109.00
  • 金融大数据:战略规划与实践指南

    陈利强 (作者)

    从金融与大数据的天然联系展开,阐述了金融行业实施大数据战略的必要性以及优势。冷静、客观的从数据角度分析了金融行业如何基于自身的特点来搭建大数据的环境,打通业务环...

    ¥79.00
  • 发现数据之美:数据分析原理与实践

    彭鸿涛 (作者)

    本书试图全面介绍IBM SPSS在构建基于数据深度分析的行业解决方案方面的预测 分析功能,试图涵盖统计分析、数据挖掘和决策管理三个方面的内容。IBM SPSS...

    ¥75.00
  • 数据可视化(全彩)

    陈为 (作者)

    可视化是数据分析处理的重要手段。国内迄今尚无一本原创的数据可视化教材。 本书的内容将以归纳介绍核心的数据可视化原理为主,每章添加一个小章节总结最新研究进展(作...

    ¥128.00

相关图书

Harbor权威指南

张海宁 邹佳 王岩 尹文开 任茂盛 等 (作者)

在云原生生态中,容器镜像和其他云原生制品的管理与分发是至关重要的一环。本书对开源云原生制品仓库Harbor展开全面讲解,由Harbor开源项目维护者和贡献者倾力...

 

裸演说:你也能成为演说达人

Garr Reynolds(加尔·雷纳德) (作者) 王佑 (译者)

本书作者是国际知名的畅销书作者,先后撰写了《演说之禅》和《设计之禅》等畅销作品,这本《裸演说》是专门写给演讲者的。作者通过生动的示例和形象的比喻回答了演讲者的困...

 

演说之禅:简约高效的幻灯片设计秘笈(第3版)

(美)Garr Reynolds(加尔·雷纳德) (作者) 王佑 (译者)

《演说之禅》是使读者从幻灯片演示制作的必然王国走向自由王国的最好读物。与目前市场中关于幻灯片制作方面的其他图书不同,《演说之禅》讲解的不是幻灯片软件的功能和操作...

 

这样学Excel数据处理与分析更高效(视频版)

陈飞 (作者)

本书融合了作者十余年授课经验编写而成。通过对本书的学习,读者可以提高数据处理与分析的效率,并进一步熟练掌握Excel在实际工作中的应用。<br>作为一本实用性书...

¥89.00

Excel人力资源管理实战宝典

刘必麟 (作者)

本书主要介绍Excel在人力资源管理中的应用。全书共分7章,涵盖了人力资源管理中的招聘管理、培训管理、员工关系管理、绩效管理、考勤与假期管理、薪酬与福利管理以及...

¥79.00

设计之禅:最强幻灯片设计原则和技巧(第2版NEW)

Garr Reynolds 加尔·雷纳德 (作者) 王佑 (译者)

《设计之禅》是畅销书《演说之禅》的姐妹篇。作者加尔·雷纳德是一位名副其实的演讲与演示专家。他的一系列关于演讲与演示的图书广受读者的赞誉和喜爱。在《设计之禅》中,...

¥89.00