数据可视化(纪念版)
  • 推荐0
  • 收藏0
  • 浏览73

数据可视化(纪念版)

陈为 等 编著 (作者)  刘皎 (责任编辑)

  • 书  号:9787121450969
  • 出版日期:2023-03-01
  • 页  数:756
  • 开  本:16(240*190)
  • 出版状态:上市销售
  • 维护人:博文小编
《数据可视化(纪念版)》共有15章,分为4篇。基础篇,阐述数据可视化的基础理论和概念,从人的感知和认知出发,介绍数据模型和可视化基础;时空数据篇,介绍带有空间坐标或时间信息的数据的可视化方法,此类数据通过设备在真实物理空间中采集得到或由科学计算模拟产生;非时空数据篇,描述非结构化和非几何的抽象数据的可视化,这些数据既存在于真实物理空间,又是社会空间和网络信息空间的基本表达形式;用户篇,介绍面向各类数据的可视化在实际应用中共同需要的方法、技术和工具,例如交互和可视化评测方法,以及在具体领域的可视化和应用系统。
《数据可视化(纪念版)》从研究者的角度,介绍数据可视化的定义、方法、效用和工具,既可作为初学者的领路手册,也可用于可视化研究和可视化工具使用的参考指南。
畅销十年经典,深度洞察数据内涵,精准挖掘数据规律
陈为
浙江大学求是特聘教授、国家高层次人才,计算机辅助设计与图形学国家重点实验室副主任;研究方向为大数据与人工智能。作为负责人先后承担了7项国家自然科学基金项目(其中包括三个重点项目、一个优青项目)、担任五家IEEE/ACM汇刊编委、多个国际顶尖会议主席。
微信公众号:datavis


沈则潜
博士,本科就读于浙江大学计算机科学与工程学系;后就读于美国加州大学戴维斯分校,获信息可视化方向博士学位。在eBay,阿里巴巴,字节跳动等互联网公司从事数据产品的研发和创新工作。研究兴趣包括信息可视化和可视分析平台。拥有多项大数据分析和可视化领域的专利,并在国际一流学术期刊和会议发表论文多篇,多次受邀参加国际顶尖学术期刊和会议的评审工作,长期致力于数据可视化的推广和普及,关注可视化技术及其商业化的最新发展。
LinkedIn(领英)地址:ZeqianShen

陶煜波
浙江大学计算机学院CAD&CG国家重点实验室副教授。于2003年,2009年分别获得浙江大学学士、博士学位。之后在浙江大学进行博士后研究,2010至2012年在英国贝德福德大学作为博士后从事生物医学可视化的研究。研究兴趣包括科学数据可视化、可视分析和电磁计算。承担国家自然科学基金等国家项目多项。在国际一流学术期刊和会议发表论文多篇,包括IEEE TVCG,IEEE TIM,IEEE TAP等。
前言
出版十周年序
数据的采集、提取和理解是人类感知和认识世界的基本途径之一,数据可视化为人类洞察数据的内涵、理解数据蕴藏的规律提供了重要的手段。在1987年美国国家科学基金会召开的“科学计算可视化研讨会”上,“科学计算可视化”这一概念首次被正式提出。自此以后,以计算机科学为主要载体的数据可视化,逐渐发展成为数据分析中一个重要的研究方向。回望可视化成为一门独立学科的历史,尚不足四十年。
在这十年中,大数据、人工智能等方向发生了天翻地覆的变化,人们的数据采集、加工、分析能力得到了革命性提升,数据可视化的研究和开发“从不受待见到趋之若鹜”,一直在创新发展中。可视分析学是一门以视觉感知增强认知为目标、以视觉理解和机器理解为对偶手段、以可视界面为信息交流通道的综合性学科。在因时、因地、临场、应急、博弈等分析决策的关键场合中,可视分析的作用尤为重要。特别地,大数据可视分析在宏观、概览、关联、隐性表达等方面具有不可替代的效应。数据量的爆炸式增长和计算过程复杂度的提升,使得人类难以挖掘海量数据反映出的模式和价值,以及理解模型背后的复杂预测机制。作为沟通人与计算之间“最后一公里”的桥梁,可视化通过其直观传神的视觉表达,在数据分析的方方面面起到至关重要的作用。
在21世纪的前10年中,可视化领域探索的重点是面向通用数据类型的视觉表达方法。这些方法在后来的可视分析研究中得到充分实践,开始深入商业、医疗、城市交通等与大众生活息息相关的行业,在各类分析应用领域中百花齐放。同时,人工智能领域的发展,也推动了可视化领域内部的方法革命,使得视觉设计的自动化成为可能,进一步降低了视觉设计的使用门槛。作为仍在前沿“奋斗”的研究者和实践者,我们也看到了一些领域中的研究趋势,希望能与各位读者分享:
首先,数据可视化研究开始逐渐从单纯的信息表达方法,向人机智能融合的可视分析方法迈进。其次,人工智能驱动的信息传达设计方法,开始在可视化流水线中得到广泛应用。最后,虚拟现实、增强现实等新兴显示平台的应用,使得人们能够身临其境地感知数据,在分析过程中拥有沉浸式体验。
十年时光倏忽而过,可视化学科的外在环境和世人对学科的认知都有着日新月异的变化。但是这其中有两个根本性的问题,是我们一直在思考和不懈探索的。其一是,如何使用视觉手段高效、真实地表达信息、反映数据内涵?这也是可视化学科的根本问题。在数据量剧增、分析任务日益复杂的今天,我们如何构建与数据规律一致的图形表达?其二,可视化本身是一门交叉学科,其研究内容涉及计算机、数据科学、人工智能、认知科学等多个方向。同时,可视化的设计和应用又需要与目标应用场景和领域专家紧密结合。那么,在可视化理论和方法的研究中,我们该如何做到学科的交叉融合,从而从容应对在复杂数据分析上的新挑战?
上述两个根本问题,表述虽然简单,做透实则不易。在探索的路上,我们也欣喜地看到不少同行做出了优秀的贡献。中国企业研制的DataV、Echarts、AntV等可视化产品和新工具不断涌现,在国内外业界和开源社区也受到了高度的认可。中国学者在可视化、人机交互等相关领域的国际顶级会议上也佳作频出,研究者数量不断扩大。本书前言作者列表中的很多青年学生学者,现在也已成为学界和业界的中坚力量。
该书面世以来,承蒙读者垂青,被国内诸多高校选为大数据和人工智能核心课程教材。在修订和再版过程中,我们接到了许多同行朋友的意见和建议,以及热心读者的反馈,这为我们进一步改进本书提供了极好的材料,在此一并表示衷心的感谢。
因本书所涉内容广泛,难免有错漏之处,敬请各位读者不吝指正。


本书作者
于2023年1月

本书导读
本书作为初学者入门的向导,适合从事可视化研究和开发的人员阅读,包括高等院校计算机、数字媒体等相关专业可视化方向的教师和学生、工业界对可视化开发与应用感兴趣的专业人员和工程师。阅读书中的可视化基础知识、案例和应用场景,读者无须具备特定的基础知识。如果需要开发和应用书中介绍的可视化算法,读者需要具备基本的编程基础,使用可视化相关类库进行开发,例如Echarts、D3、VTK等。
本书共有15章,分为4篇,建议初学者可以先阅读基础篇的第1~4章,了解数据可视化的基本理论和概念,例如颜色理论、可视编码原则、数据可视化的基本框架等。
时空数据篇(第5~7章)和非时空数据篇(第8~11章)介绍了数据可视化的不同主题:第5~6章介绍了空间标量场、向量场和张量场数据的可视化方法,第7章介绍带有时间信息的数据可视化,第8~10章分别介绍了层次和网络数据可视化、文本数据可视化和跨媒体数据可视化的各类方法,第11章介绍复杂高维多元数据的可视化方法,例如多变量非结构化数据、不确定性数据等。
关于时空数据篇和非时空数据篇,建议读者选择感兴趣的主题阅读,例如科学数据可视化(第5~6章)、网络可视化(第8章)、文本可视化(第9章)等。在阅读感兴趣的主题后,读者可以根据所提供的参考文献深入阅读和理解,并通过编程实现相关的可视化算法。
用户篇(第12~15章)分别介绍了可视化的交互、可视化评测、面向领域的数据可视化、可视化研究与开发资源,建议读者阅读第12章和第13章,根据具体应用需求,阅读第14章的部分内容。

本书提供了丰富的学习资源信息,第1~14章给出了大量参考文献,可视化研究人员可以挑选部分参考文献进行深入阅读,了解可视化领域的发展趋势。第15章提供了可视化软件、开发工具、数据与信息资源,可视化应用人员可以从中选择符合要求的可视化软件,进行可视化创作与应用,可视化开发人员可以利用熟悉的开发工具,实现或改进可视化算法,可视化研究人员可以根据信息资源,获得可视化领域的前沿进展。

目录

基 础 篇
第1 章 数据可视化简介 2
1.1 可视化释义 2
1.2 可视化简史 8
1.3 数据可视化详解 23
1.3.1 数据科学的发展 23
1.3.2 数据可视化的意义 25
1.3.3 数据可视化分类 29
1.3.4 数据可视化与其他学科领域的关系 38
1.4 数据可视化研究挑战 43
参考文献 44

第2 章 视觉感知与认知 47
2.1 视觉感知和认知 47
2.1.1 视觉感知和认知的定义 48
2.1.2 视觉感知处理过程 48
2.1.3 格式塔理论 49
2.1.4 相关实验 56
2.2 颜色 57
2.2.1 颜色刺激理论 57
2.2.2 色彩空间 61
2.3 视觉编码原则 66
2.3.1 相对判断和视觉假象 66
2.3.2 标记和视觉通道 69
2.3.3 视觉通道的概念 71
2.3.4 视觉通道的特性 77
参考文献 88

第3 章 数据 91
3.1 总览 91
3.2 数据基础 96
3.2.1 数据分类 96
3.2.2 数据集 96
3.2.3 数据相似度与密度 97
3.3 数据获取、清洗和预处理 98
3.3.1 数据获取 98
3.3.2 数据清洗 99
3.3.3 数据精简 102
3.3.4 其他常用的数据预处理步骤 103
3.4 数据组织与管理 104
3.4.1 数据整合与集成 106
3.4.2 数据库与数据仓库 108
3.5 数据分析与挖掘 111
3.5.1 探索式数据分析 113
3.5.2 联机分析处理 113
3.5.3 数据挖掘 116
3.6 数据科学与可视化 118
3.6.1 数据工作流 118
3.6.2 可视数据挖掘 122
3.7 数据科学的挑战 130
参考文献 131

第4 章 数据可视化基础 136
4.1 数据可视化基本框架 136
4.1.1 数据可视化流程 136
4.1.2 数据可视化设计 140
4.2 可视化中的数据 143
4.2.1 数据认知 143
4.2.2 数据类型 143
4.3 可视化的基本图表 145
4.3.1 原始数据绘图 145
4.3.2 简单统计值标绘 150
4.3.3 多视图协调关联 151
4.4 可视化设计原则 153
4.4.1 数据到可视化的直观映射 153
4.4.2 视图选择与交互设计 155
4.4.3 信息密度――数据的筛选 156
4.4.4 美学因素 157
4.4.5 动画与过渡 159
4.4.6 可视化隐喻 163
4.4.7 颜色与透明度 164
4.5 可视化理论发展 164
4.5.1 图形符号学 165
4.5.2 关系数据的图形表示 166
4.5.3 图形语法 167
4.5.4 基于数据类型的研究 168
4.5.5 基于数据状态模型的研究 169
4.5.6 多维关系数据库可视化分析系统 170
参考文献 171

时空数据篇
第5 章 空间标量场可视化 174
5.1 一维标量场可视化 174
5.2 二维标量场可视化 176
5.2.1 颜色映射 177
5.2.2 等值线 178
5.2.3 高度图 179
5.3 三维标量场数据可视化 179
5.3.1 空间数据表达 182
5.3.2 空间数据特征计算 187
5.3.3 间接体绘制 192
5.3.4 规则三维标量场的直接体可视化 197
5.3.5 不规则体数据的体可视化 221
参考文献 233

第6 章 大规模多变量空间数据场可视化 243
6.1 大规模空间标量场数据的实时可视化 244
6.1.1 大规模空间标量场数据的单机绘制 244
6.1.2 大规模空间标量场数据的并行绘制 245
6.1.3 时变空间标量场数据加速绘制方法 247
6.2 时变异构空间数据场的特征追踪与可视化 248
6.2.1 时变空间标量场数据的特征提取 248
6.2.2 异构数据的特征融合 249
6.2.3 时变空间标量场数据的特征追踪 250
6.3 空间向量场数据可视化 253
6.3.1 图标法 255
6.3.2 几何法 257
6.3.3 纹理法 262
6.3.4 拓扑法 265
6.4 空间张量场数据可视化 267
6.4.1 张量场的数学描述 268
6.4.2 基于几何的方法 271
6.4.3 基于纹理的方法 275
6.4.4 基于拓扑的方法 278
6.4.5 高阶张量场可视化 281
6.5 多变量空间数据场可视化 282
6.5.1 多变量空间数据场的特征表达与关联分析 283
6.5.2 多变量空间数据场的可视化与交互 287
参考文献 290

第7 章 时变数据可视化 305
7.1 时间属性的可视化 307
7.1.1 线性和周期时间可视化 308
7.1.2 日历时间可视化 312
7.1.3 分支和多角度时间可视化 314
7.1.4 时间属性的动态可视化 319
7.2 多变量时变型数据可视化 320
7.2.1 基于线表示的可视化 321
7.2.2 基于图结构的可视化 325
7.2.3 时间序列数据的可视化交互 326
7.3 流数据可视化 327
7.3.1 流数据可视化模型 327
7.3.2 流数据处理技术 328
7.3.3 流数据可视化案例 331
7.3.4 并行流计算框架 337
参考文献 339

非时空数据篇
第8 章 层次和网络数据可视化 344
8.1 层次数据 344
8.1.1 层次数据的可视化 348
8.1.2 节点- 链接法 349
8.1.3 空间填充法 357
8.1.4 其他方法 365
8.2 网络数据 367
8.2.1 网络和图 367
8.2.2 网络数据可视化 368
8.2.3 网络数据的地图隐喻可视化 382
8.2.4 超图及其可视化 385
8.2.5 动态网络数据可视化 387
8.2.6 图可视化的视觉效果 390
8.2.7 图可视化中的交互 398
8.2.8 网络数据可视化的挑战 400
参考文献 401

第9 章 文本和文档可视化 409
9.1 文本可视化释义 409
9.1.1 文本信息的层级 409
9.1.2 文本可视化的研究内容与任务 410
9.1.3 文本可视化流程 411
9.2 文本信息分析基础 412
9.2.1 分词技术和词干提取 412
9.2.2 数据模型 413
9.3 文本内容可视化 417
9.3.1 基于关键词的文本内容可视化 417
9.3.2 时序性的文本内容可视化 421
9.3.3 文本特征的分布模式可视化 424
9.3.4 文档信息检索可视化 428
9.3.5 软件可视化 430
9.4 文本关系可视化 432
9.4.1 文档相似性可视化 432
9.4.2 文本内容关联可视化 435
9.4.3 文档集合关系可视化 437
9.5 文件情感分析可视化 439
9.5.1 顾客评价可视化 440
9.5.2 情感变化可视化 441
9.5.3 情感差异可视化 443
9.6 总结 444
参考文献 444

第10 章 跨媒体数据可视化 448
10.1 图像 448
10.1.1 图像网格 448
10.1.2 基于时空采样的图像集可视化 449
10.1.3 基于相似性的图像集可视化 450
10.1.4 基于海塞图的社交图像可视化 451
10.1.5 基于故事线的社交图像可视化 452
10.2 视频 453
10.2.1 视频摘要 453
10.2.2 视频抽象 456
10.3 声音与音乐 459
10.3.1 声乐波形可视化 461
10.3.2 声乐结构的可视化 462
10.4 超媒体 465
10.4.1 社交媒体可视化 468
10.4.2 社交网络可视化 476
10.5 数字生活可视化 487
参考文献 490

第11 章 复杂高维多元数据的可视化 493
11.1 高维多元数据 494
11.1.1 空间映射法 495
11.1.2 图标法 511
11.1.3 基于像素图的方法 514
11.1.4 基于动画的方法 517
11.2 非结构化与异构数据的可视化 518
11.2.1 非结构化数据 518
11.2.2 异构数据 520
11.3 大尺度数据的可视化 523
11.3.1 基于并行的大尺度数据高分辨率可视化 523
11.3.2 大尺度数据的分而治之可视化与分析 527
11.4 数据不确定性的可视化 531
11.4.1 不确定性的基本定义 532
11.4.2 不确定性的来源 532
11.4.3 不确定性的可视化方法 533
参考文献 550

用 户 篇
第12 章 可视化中的交互 558
12.1 交互准则 559
12.1.1 交互延时 559
12.1.2 交互成本 561
12.1.3 交互场景变化 562
12.2 交互分类 563
12.2.1 按低阶交互操作分类 563
12.2.2 按交互操作符与空间分类 564
12.2.3 按交互任务分类 564
12.3 交互技术 565
12.3.1 选择 565
12.3.2 导航 567
12.3.3 重配 569
12.3.4 编码 571
12.3.5 抽象/ 具象 573
12.3.6 过滤 574
12.3.7 关联 579
12.3.8 概览+ 细节 581
12.3.9 焦点+ 上下文 584
12.4 交互与硬件设备 593
12.4.1 交互环境 594
12.4.2 交互设备 596
参考文献 599

第13 章 可视化效果评测与用户实验 607
13.1 评测流程 608
13.2 评测方法 609
13.2.1 用户实验(User Studies) 609
13.2.2 专家评估(Expert Review/Heuristic Evaluation) 609
13.2.3 案例研究(Case Studies and Use Cases) 610
13.2.4 指标评估(Metrics) 612
13.2.5 众包(Crowdsourcing) 612
13.2.6 标注(Labeling) 613
13.3 用户实验 613
13.3.1 确定实验目标 613
13.3.2 准备实验 615
13.3.3 进行实验 619
13.3.4 分析结果并讨论 619
13.3.5 评测案例分析 620
13.4 总结 632
参考文献 632

第14 章 面向领域的数据可视化 635
14.1 高性能科学计算 635
14.1.1 高性能科学可视化的挑战 637
14.1.2 重要信息的提取和显示 640
14.1.3 原位可视化 642
14.1.4 未来挑战 645
14.2 生命科学 645
14.2.1 临床医学影像 645
14.2.2 其他影像 651
14.2.3 电生理信号 655
14.2.4 OMICS 组学 658
14.2.5 深度学习 662
14.3 其他科学与艺术 663
14.3.1 气候学与气象中的可视化 663
14.3.2 面向艺术的表意性可视化 667
14.4 网络与系统安全的可视化 671
14.4.1 基于可视变换的虫洞攻击可视化 671
14.4.2 可信计算的可视化 672
14.4.3 安全日志数据的可视化 673
14.4.4 智能电网数据的可视化 673
14.5 商业智能可视化 674
14.5.1 商业智能 675
14.5.2 商业智能中的数据可视化 676
14.5.3 云端商业智能 680
14.5.4 未来趋势 681
14.6 金融数据可视化 681
14.6.1 金融数据来源 682
14.6.2 金融数据分析的自动化方法 683
14.6.3 金融数据可视化方法 683
14.6.4 金融数据可视分析 686
参考文献 690

第15 章 可视化研究与开发资源 698
15.1 可视化软件 698
15.1.1 医学可视化软件 698
15.1.2 科学可视化软件 700
15.1.3 信息可视化软件 704
15.1.4 可视分析软件 709
15.2 可视化开发工具 709
15.2.1 应用程序开发工具 709
15.2.2 Web 应用开发工具712
15.3 数据分析和数据挖掘软件与开发工具 714
15.4 可视化数据集资源 716
15.5 可视化信息资源 718
15.6 海外可视化研究机构 719

读者评论