《数据可视化分析(第2版):分析原理和Tableau、SQL实践(全彩)》以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。
《数据可视化分析(第2版):分析原理和Tableau、SQL实践(全彩)》以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的“业务—数据—分析”层次框架,并以三类“详细级别”的概念贯通数据模型、高级筛选和高级计算三大主题。
《数据可视化分析(第2版):分析原理和Tableau、SQL实践(全彩)》重点介绍工具应用背后的思考方式和原理,帮助读者建立“详细级别”的思考框架,举一反三,从而实现多维、结构化分析。
Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等
喜乐君
Tableau Visionary(2020—2023)、数据分析咨询顾问、培训讲师·敏捷BI“布道师”。
连续创业者、上海唯知唯识创始人。
山东大学法学学士、教育学硕士,首届“硕士研究生国家奖学金”获得者。
站在业务角度、深入行业一线,借Tableau洞悉敏捷分析,重新理解和诠释“业务数据分析”。
第2版自序
感谢Tableau和读者的支持,是你们给了笔者继续前进的动力。
2020年年初,我把多年学习Tableau的所思、所想毫无保留地写出来,配以精致的图片出版发行。《数据可视化分析:Tableau原理与实践》一书收到了众多读者的一致好评,累计印刷8次,发行逾万册,多次入围“京东大数据推荐榜单”前三名。在读者群中,笔者认识了很多Tableau粉丝、企业用户及可视化爱好者。
过去两年多,Tableau产品持续更新迭代,笔者也进一步补充了SQL、数据库、数据仓库等基础知识,并对比学习了Power BI、帆软、观远等国内外多家优秀BI产品的应用。“实践是最好的老师”,笔者在分析项目咨询、Tableau企业培训、可视化开发项目的锻炼中,日渐意识到这本书中的诸多不足甚至错误,并放弃了小修小补的计划,重写此书作为近两年学习的总结。
于是,2022年4月,笔者开始重写本书的内容,并重新绘制、调整了大部分插图,作为第2版。历经波折,多次延迟,本书终于与读者见面。
这里,笔者总结第2版相对于第1版的内容改进。
1. 第2版改进
增加对数字化转型的实践思考。
结合笔者多年的切身项目实践,本书总结了数据的应用及其发展阶段,数字化转型的多种路径和循序渐进的组织方案(见第1章)。
业务分析方法和体系更加成熟。
业务是分析的“土壤”。在项目咨询过程中,笔者提出了“业务—数据—分析”的框架体系,可以与企业业务流程相结合绘制数据地图(见第2章)。同时,围绕问题结构、聚合、聚合度和详细级别,构建了一个普适性的业务分析方法,适用于各种分析和BI工具,甚至可以作为衡量分析工具的一种尺度(见第3章)。
在数据合并、筛选、计算三大主题中,对比介绍了Excel、Tableau和SQL的应用场景。书中总结了“数据合并的分类矩阵”“两类筛选位置”“计算的分类”等实用方法,帮助没有相关技术背景的人更快实现超越,也有助于熟悉SQL的“技术派”更好地理解敏捷BI的精髓。高阶的BI工具绝非拖曳那般简单,在技术平民化的背后,是更巧妙的“业务灵魂”。
将“数据筛选和交互”独立为第6章内容,进一步强调筛选在业务分析中的重要性。筛选的类型多样、优先级复杂,应该尽可能避免滥用SUM+IF类型的条件聚合。将筛选视为分析的独立环节,是优化分析性能的关键方式。
强化“详细级别”的概念(替代之前的“层次”概念)。在数据表详细级别(Table LOD)、视图详细级别(Viz LOD)之外,使用“引用详细级别”(Reference LOD)代表视图之外预先指定的详细级别。笔者把数据关系、筛选和计算融为一体,这是本书最重要的知识资产,是超越Tableau理解不同工具背后的分析共性的关键。
调整了第3篇的知识框架。没有计算,就没有无尽的业务分析,这也是本书最重要的内容之一。
第8章深入介绍了计算的两大分类:行级别计算完成数据准备、聚合计算完成业务分析。在介绍常见函数后,借助逻辑计算介绍了两类计算的区别和联系。
第9章使用了新的框架介绍Tableau表计算和SQL窗口函数,表计算代表的“抽象的二次抽象”,是迈向高级分析的台阶。
第10章则结合“SQL聚合子查询”深入讲解LOD原理,结合购物篮分析、客户分析等经典案例,把高级分析中“预先聚合”的理念,推广到更普遍的业务分析中。
增加了“从数据管理到数据仓库”的内容(见第11章),相关内容是从可视化分析走向专业的数据建模、数据方法的关键。“视Tableau Server为DW/BI平台”,给了更多企业全新选择。
受限于篇幅,移除了之前Prep Builder数据处理、Tableau Server相关的大部分内容。
2. 致谢
每次写作完成,笔者总是迫不及待地分享。本书付梓之前,笔者在上海组织了“喜乐君精品课”线下活动,详尽介绍了本书的核心内容。教学相长,在分享过程中笔者进一步发现了自身知识体系的盲点。感谢来自天合光能、汉德车桥、上海电气、海南航空、上汽集团、英飞凌等企业的热心读者。
感谢继续支持和信任笔者的企业客户,笔者希望能用专业和热爱回报大家。
感谢Tableau,你给了笔者穿过迷雾的勇气,笔者也将无期限地支持你,对得起“Tableau传道士”的称号,对得起Tableau Zen Master/Visionary的全球荣誉。
感谢父母,感谢家人,“大爱无言”,笔者当用余生以行动回报。
喜乐君
2023年1月20日