《数据可视化(纪念版)》共有15章,分为4篇。基础篇,阐述数据可视化的基础理论和概念,从人的感知和认知出发,介绍数据模型和可视化基础;时空数据篇,介绍带有空间坐标或时间信息的数据的可视化方法,此类数据通过设备在真实物理空间中采集得到或由科学计算模拟产生;非时空数据篇,描述非结构化和非几何的抽象数据的可视化,这些数据既存在于真实物理空间,又是社会空间和网络信息空间的基本表达形式;用户篇,介绍面向各类数据的可视化在实际应用中共同需要的方法、技术和工具,例如交互和可视化评测方法,以及在具体领域的可视化和应用系统。
《数据可视化(纪念版)》从研究者的角度,介绍数据可视化的定义、方法、效用和工具,既可作为初学者的领路手册,也可用于可视化研究和可视化工具使用的参考指南。
畅销十年经典,深度洞察数据内涵,精准挖掘数据规律
陈为
浙江大学求是特聘教授、国家高层次人才,计算机辅助设计与图形学国家重点实验室副主任;研究方向为大数据与人工智能。作为负责人先后承担了7项国家自然科学基金项目(其中包括三个重点项目、一个优青项目)、担任五家IEEE/ACM汇刊编委、多个国际顶尖会议主席。
微信公众号:datavis
沈则潜
博士,本科就读于浙江大学计算机科学与工程学系;后就读于美国加州大学戴维斯分校,获信息可视化方向博士学位。在eBay,阿里巴巴,字节跳动等互联网公司从事数据产品的研发和创新工作。研究兴趣包括信息可视化和可视分析平台。拥有多项大数据分析和可视化领域的专利,并在国际一流学术期刊和会议发表论文多篇,多次受邀参加国际顶尖学术期刊和会议的评审工作,长期致力于数据可视化的推广和普及,关注可视化技术及其商业化的最新发展。
LinkedIn(领英)地址:ZeqianShen
陶煜波
浙江大学计算机学院CAD&CG国家重点实验室副教授。于2003年,2009年分别获得浙江大学学士、博士学位。之后在浙江大学进行博士后研究,2010至2012年在英国贝德福德大学作为博士后从事生物医学可视化的研究。研究兴趣包括科学数据可视化、可视分析和电磁计算。承担国家自然科学基金等国家项目多项。在国际一流学术期刊和会议发表论文多篇,包括IEEE TVCG,IEEE TIM,IEEE TAP等。
前言
出版十周年序
数据的采集、提取和理解是人类感知和认识世界的基本途径之一,数据可视化为人类洞察数据的内涵、理解数据蕴藏的规律提供了重要的手段。在1987年美国国家科学基金会召开的“科学计算可视化研讨会”上,“科学计算可视化”这一概念首次被正式提出。自此以后,以计算机科学为主要载体的数据可视化,逐渐发展成为数据分析中一个重要的研究方向。回望可视化成为一门独立学科的历史,尚不足四十年。
在这十年中,大数据、人工智能等方向发生了天翻地覆的变化,人们的数据采集、加工、分析能力得到了革命性提升,数据可视化的研究和开发“从不受待见到趋之若鹜”,一直在创新发展中。可视分析学是一门以视觉感知增强认知为目标、以视觉理解和机器理解为对偶手段、以可视界面为信息交流通道的综合性学科。在因时、因地、临场、应急、博弈等分析决策的关键场合中,可视分析的作用尤为重要。特别地,大数据可视分析在宏观、概览、关联、隐性表达等方面具有不可替代的效应。数据量的爆炸式增长和计算过程复杂度的提升,使得人类难以挖掘海量数据反映出的模式和价值,以及理解模型背后的复杂预测机制。作为沟通人与计算之间“最后一公里”的桥梁,可视化通过其直观传神的视觉表达,在数据分析的方方面面起到至关重要的作用。
在21世纪的前10年中,可视化领域探索的重点是面向通用数据类型的视觉表达方法。这些方法在后来的可视分析研究中得到充分实践,开始深入商业、医疗、城市交通等与大众生活息息相关的行业,在各类分析应用领域中百花齐放。同时,人工智能领域的发展,也推动了可视化领域内部的方法革命,使得视觉设计的自动化成为可能,进一步降低了视觉设计的使用门槛。作为仍在前沿“奋斗”的研究者和实践者,我们也看到了一些领域中的研究趋势,希望能与各位读者分享:
首先,数据可视化研究开始逐渐从单纯的信息表达方法,向人机智能融合的可视分析方法迈进。其次,人工智能驱动的信息传达设计方法,开始在可视化流水线中得到广泛应用。最后,虚拟现实、增强现实等新兴显示平台的应用,使得人们能够身临其境地感知数据,在分析过程中拥有沉浸式体验。
十年时光倏忽而过,可视化学科的外在环境和世人对学科的认知都有着日新月异的变化。但是这其中有两个根本性的问题,是我们一直在思考和不懈探索的。其一是,如何使用视觉手段高效、真实地表达信息、反映数据内涵?这也是可视化学科的根本问题。在数据量剧增、分析任务日益复杂的今天,我们如何构建与数据规律一致的图形表达?其二,可视化本身是一门交叉学科,其研究内容涉及计算机、数据科学、人工智能、认知科学等多个方向。同时,可视化的设计和应用又需要与目标应用场景和领域专家紧密结合。那么,在可视化理论和方法的研究中,我们该如何做到学科的交叉融合,从而从容应对在复杂数据分析上的新挑战?
上述两个根本问题,表述虽然简单,做透实则不易。在探索的路上,我们也欣喜地看到不少同行做出了优秀的贡献。中国企业研制的DataV、Echarts、AntV等可视化产品和新工具不断涌现,在国内外业界和开源社区也受到了高度的认可。中国学者在可视化、人机交互等相关领域的国际顶级会议上也佳作频出,研究者数量不断扩大。本书前言作者列表中的很多青年学生学者,现在也已成为学界和业界的中坚力量。
该书面世以来,承蒙读者垂青,被国内诸多高校选为大数据和人工智能核心课程教材。在修订和再版过程中,我们接到了许多同行朋友的意见和建议,以及热心读者的反馈,这为我们进一步改进本书提供了极好的材料,在此一并表示衷心的感谢。
因本书所涉内容广泛,难免有错漏之处,敬请各位读者不吝指正。
本书作者
于2023年1月
本书导读
本书作为初学者入门的向导,适合从事可视化研究和开发的人员阅读,包括高等院校计算机、数字媒体等相关专业可视化方向的教师和学生、工业界对可视化开发与应用感兴趣的专业人员和工程师。阅读书中的可视化基础知识、案例和应用场景,读者无须具备特定的基础知识。如果需要开发和应用书中介绍的可视化算法,读者需要具备基本的编程基础,使用可视化相关类库进行开发,例如Echarts、D3、VTK等。
本书共有15章,分为4篇,建议初学者可以先阅读基础篇的第1~4章,了解数据可视化的基本理论和概念,例如颜色理论、可视编码原则、数据可视化的基本框架等。
时空数据篇(第5~7章)和非时空数据篇(第8~11章)介绍了数据可视化的不同主题:第5~6章介绍了空间标量场、向量场和张量场数据的可视化方法,第7章介绍带有时间信息的数据可视化,第8~10章分别介绍了层次和网络数据可视化、文本数据可视化和跨媒体数据可视化的各类方法,第11章介绍复杂高维多元数据的可视化方法,例如多变量非结构化数据、不确定性数据等。
关于时空数据篇和非时空数据篇,建议读者选择感兴趣的主题阅读,例如科学数据可视化(第5~6章)、网络可视化(第8章)、文本可视化(第9章)等。在阅读感兴趣的主题后,读者可以根据所提供的参考文献深入阅读和理解,并通过编程实现相关的可视化算法。
用户篇(第12~15章)分别介绍了可视化的交互、可视化评测、面向领域的数据可视化、可视化研究与开发资源,建议读者阅读第12章和第13章,根据具体应用需求,阅读第14章的部分内容。
本书提供了丰富的学习资源信息,第1~14章给出了大量参考文献,可视化研究人员可以挑选部分参考文献进行深入阅读,了解可视化领域的发展趋势。第15章提供了可视化软件、开发工具、数据与信息资源,可视化应用人员可以从中选择符合要求的可视化软件,进行可视化创作与应用,可视化开发人员可以利用熟悉的开发工具,实现或改进可视化算法,可视化研究人员可以根据信息资源,获得可视化领域的前沿进展。