Power Query数据清理从入门到精通
  • 推荐0
  • 收藏0
  • 浏览65

Power Query数据清理从入门到精通

陈平 (作者)  张月萍 (责任编辑)

  • 书  号:9787121445682
  • 出版日期:2023-01-01
  • 页  数:284
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:张月萍
《Power Query实战:Excel智能化数据清洗神器应用精讲》从Power Query的M语言的基础语法讲起,从清洗各种类型数据逐步深入到实现与外部AI功能对接,每一章基本上都配有项目实战案例,突出了函数的使用方法,拆解了计算过程,让读者不仅可以系统地学习编程的相关知识,还能够对Power Query应用开发有更加深入的理解。
《Power Query实战:Excel智能化数据清洗神器应用精讲》共15章,涵盖的主要内容有Power Query的简介及基础语法,Power Query中从多种数据源导入数据的方法,自制文件管理器案例,在Power Query中实现条件计算、数据去重、匹配扩展、分隔提取字符等,在Power Query中模拟Excel的绝对引用和相对引用,以电商平台批量上传产品数据表为例,介绍Power Query中的数据自动化处理功能,商品库存管理,根据指定规则分隔数据,多行多列数据的清洗方法,在Power Query中进行有关时间的计算,提取代码中的数据,Power Query中自定义函数的编写基础,使用Power Query对接人工智能API处理数据。
《Power Query实战:Excel智能化数据清洗神器应用精讲》从基础入手,通过丰富的案例对函数的计算过程进行详细解释,不仅适合入门读者和进阶读者阅读,也适合经常使用Excel的办公人员阅读。另外,本书还适合作为相关培训机构的教材。
本书主要是以案例为主,通过案例来讲解Power Query中的函数应用,从基础知识到和AI智能结合,不仅对初学者,而且对于进阶者也有一定的参考意义。一、大数据的时代,通过Excel常规操作已无法胜任,需要换代升级工具来实现。二、针对Excel的常用操作进行对比,使得Excel的操作自动化。三、因为作为代码的一部分,很多都无法通过计算过程完全展示出来,所以在本书的配图中使用了大量的中间过程描述,使得读者对于过程更能理解。
商务智能数据清洗数据分析利器。Excel数据整理自动化,Excel用户值得掌握的工具
陈平,长居上海,曾创办跨境独立站兼任运营总监,并在多家跨境物流企业从事市场及渠道分析工作多年,他结合市场的数据分析所提出的建议成功帮助企业提升了产品的销量。在开通“数据技巧”微信公众号后,他的原创文章累计近300篇,并在简书、今日头条等平台进行分享,深得读者认可。
前言
在大数据时代,数据的来源具有多样性、复杂性。针对数量庞大、渠道及格式多样的数据,数据清洗就成为刚需。在数据分析中,数据清洗实际上是十分繁重且关键的一步。Power Query作为数据清洗的工具,能将这些多源的数据集中并统一转换成所需要的格式,为数据分析创造前提条件。
此外,Power Query还能使办公自动化更进一步,与常用办公软件Excel无缝衔接,使日常的重复工作实现自动化,得到高效并准确的处理结果,不仅可以为企业节省人力成本,还可以为个人节省时间。
作者的使用体会
在未使用Power Query之前,作者常用的是Excel中的函数,但是自从使用了Power Query,很多在Excel中看似困难的操作只需要进行简单的处理即可完成,甚至都不需要自己编写函数,直接在操作界面中操作即可。对于没有编程经验的人来说,使用Power Query的关键就是搞清楚数据的格式,如果理解了这一点,那么在使用函数的过程中会容易很多。
本书的特色
Power Query中的函数多达几百个,选择案例中介绍的那些常用的函数并熟练运用,基本上可以解决工作中遇到的大部分问题。本书不仅说明了操作过程,还帮助读者拓展思路,使读者能够举一反三地来解决问题;同时,通过丰富的案例对函数的计算过程进行详细解释,使读者能够更好地理解函数的计算过程,更清楚函数的计算逻辑。
本书读者对象
经常使用Excel的办公人员
经常需要整合各个渠道数据的人员
经常需要生成不同报表的统计人员
企业运营管理及分析人员
做市场分析的统计人员
其他对数据整理及分析感兴趣的人员
本书包括什么内容
第1章:主要介绍Power Query的一些基本概念,如Power Query的作用、打开方式、主界面功能、数据类型、函数概况、基础语法、数据的引用方式等。
第2章:介绍Power Query中从多种数据源导入数据的方法,如从Excel工作簿、工作表、表格、文本文件、文件夹、MySQL数据库、Web页面及其他数据源导入数据。
第3章:以自制文件管理器作为案例,通过数据的获取、提取、判断和筛选等方式来熟悉一些基本操作,最后利用批处理文件来批量移动、复制、删除和重命名文件。
第4章:对比Excel中的条件计算公式,了解Power Query中的数据自动化清洗计算功能。
第5章:对比Excel中的数据去重及数据匹配功能,了解Power Query中VLOOKUP匹配函数的实现方法。
第6章:对比Excel中提取文本中数据的方法,了解Power Query中功能更强大的提取方式,包括提取任意数字、英文、符号及指定国家语言字符等。
第7章:对比Excel中的绝对引用和相对引用,了解在Power Query中实现相对引用、绝对引用和混合引用的方法。
第8章:以电商平台批量上传产品数据表作为案例,通过分析目标表格式,介绍如何使用Power Query对源数据表格进行清洗并达到目标表格式的要求,以及如何处理标题内容和列的顺序不符合要求的表格。
第9章:以库存的断码缺货及补货作为案例,通过Power Query对数据进行清洗,使其能自动显示断码缺货的情况及补货的需求。
第10章:对比Excel中的“分列”功能,Power Query中“拆分列”功能的规则具有多样性,不仅可以按分隔符、按字符数、按位置来拆分列,还可以按照既有规则转换拆分列,以及自定义规则转换拆分列(如中文转英文、英文转数字等)。
第11章:使用Power Query对合并单元格的数据进行处理,使其成为可用于分析的数据,包括列标题的合并、行标题的合并、数据值的合并等。
第12章:主要介绍Power Query中时间类函数的应用、日期及时间类函数的主要分类、日期格式的互相转换等,以排班表和账期计算作为案例来充分展示时间类函数的应用。
第13章:主要介绍如何提取带有table标签的网页数据,如何对JSON格式的数据进行清洗,以及如何提取代码中的指定数据。
第14章:主要介绍Power Query中的函数概念、自定义函数的备注,以及自定义函数实战。
第15章:使用Power Query进行人工智能开发,通过解读开放文档中的说明,连接开放的API,使数据处理更加智能化。

目录

第1章 Power Query简介
1.1 Power Query的作用
1.2 Power Query的打开方式
1.3 Power Query主界面功能介绍
1.4 Power Query中的数据类型
1.4.1 数据结构的类型
1.4.2 数据结构的创建
1.4.3 数据值的类型
1.5 Power Query中的函数概况
1.5.1 函数功能分类
1.5.2 主要函数的分布
1.5.3 函数的使用方法
1.6 Power Query中的基础语法
1.6.1 let…in…语句
1.6.2 if…then…else…语句
1.6.3 try…otherwise…语句
1.7 Power Query中数据的引用方式
1.7.1 引用查询表的整表数据
1.7.2 引用查询表中的单列数据
1.7.3 引用查询表中的单行数据
1.7.4 引用查询表中的值数据
1.7.5 引用查询表中的部分列数据
1.7.6 引用查询表中的部分行数据
1.7.7 引用查询记录中的数据
1.7.8 引用查询列表中的数据

第2章 汇总多个数据来源
2.1 从Excel的超级表及自定义的名称中导入数据
2.1.1 Excel中的超级表及名称的生成
2.1.2 如何快速分辨超级表
2.1.3 “数据”选项卡中的“从表格”选项
2.1.4 从表格导入数据涉及的Power Query函数
2.2 从Excel的工作表及工作簿中导入数据
2.3 从文本文件中导入数据
2.3.1 按规则分隔的文本文件
2.3.2 无分隔符的文本文件
2.4 从文件夹中导入数据
2.4.1 获取文件夹下的文件信息
2.4.2 提取文件内容
2.5 从MySQL数据库中导入数据
2.5.1 从MySQL数据库中提取函数
2.5.2 身份的验证
2.5.3 提取数据库中的表格内容
2.5.4 指定SQL语句进行提取
2.6 从Web页面中导入数据
2.7 从其他数据源中导入数据
2.7.1 从HTML文件中导入数据
2.7.2 从PDF文件中导入数据

第3章 自制文件管理器案例
3.1 从文件夹中获取所需要的数据
3.1.1 设置文件匹配信息的参数表格
3.1.2 获取指定文件夹下的数据
3.2 数据判断及筛选
3.2.1 提取默认文件路径
3.2.2 判断是否使用默认文件路径
3.2.3 提取文件大小信息
3.2.4 判断是否包含子文件夹
3.2.5 筛选文件类型
3.2.6 筛选文件大小
3.2.7 筛选修改日期
3.2.8 筛选文件名
3.3 利用Excel函数进行文件跳转
3.4 利用批处理文件批量移动、复制、删除和重命名文件
3.4.1 移动
3.4.2 复制
3.4.3 删除
3.4.4 重命名

第4章 根据指定条件进行数据统计
4.1 Excel中SUMIF函数的语法及功能介绍
4.1.1 SUMIF函数
4.1.2 条件区域(range)
4.1.3 求和条件(criteria)
4.1.4 求和区域(sum_range)
4.2 Excel中SUMIFS函数的语法及功能介绍
4.2.1 SUMIFS函数
4.2.2 求和区域(sum_range)
4.2.3 条件1的区域(criteria_range1)
4.2.4 求和条件1(criteria1)
4.2.5 条件2的区域(criteria_range2)
4.2.6 求和条件2(criteria2)
4.3 Power Query中实现的方法
4.3.1 通过分组计算
4.3.2 通过筛选表聚合求值
4.3.3 通过列计算求值
4.3.4 对含有通配符的条件进行匹配求值
4.3.5 多条件数据统计

第5章 数据的去重及匹配扩展
5.1 Excel中的数据去重方法
5.1.1 使用数据透视表去重
5.1.2 使用“删除重复值”按钮去重
5.1.3 使用条件格式去重
5.2 Power Query中的数据去重方法
5.2.1 Power Query中的单列数据去重
5.2.2 Power Query中的多列数据去重
5.3 Excel中的匹配扩展
5.3.1 VLOOKUP函数的绝对匹配
5.3.2 VLOOKUP函数的模糊匹配
5.3.3 使用INDEX和MATCH函数组合进行查找和匹配
5.4 Power Query中的匹配扩展
5.4.1 Power Query中的绝对匹配扩展
5.4.2 Power Query合并查询中的联接种类
5.4.3 Power Query中的模糊匹配扩展
5.4.4 Power Query使用阈值进行匹配扩展
5.4.5 Power Query多列条件的匹配扩展

第6章 提取复杂字符串中的任意字符
6.1 提取简单文本中的数字
6.1.1 使用Excel公式提取数据
6.1.2 使用“分列”功能提取数据
6.2 提取复杂文本中的数字
6.2.1 使用Excel数组公式提取数据
6.2.2 使用Excel快捷键提取数据
6.2.3 使用Excel插件中的自定义函数提取数据
6.3 使用Power Query提取任意数据
6.3.1 提取文本中的数字
6.3.2 提取文本中的英文字符和中文字符
6.3.3 提取文本中的他国语言字符
6.3.4 通过排除法提取字符

第7章 模拟Excel中的绝对引用和相对引用
7.1 Excel中的绝对引用和相对引用的介绍
7.1.1 Excel中的绝对引用拖曳
7.1.2 Excel中的相对引用拖曳
7.1.3 Excel中的混合引用拖曳
7.2 Power Query中的引用方法
7.2.1 Power Query中的绝对引用
7.2.2 Power Query中的相对引用
7.2.3 Power Query中错行的相对引用
7.2.4 Power Query中错列的相对引用
7.3 Power Query中的累计方法
7.3.1 Excel中的累计方法
7.3.2 使用类似Excel中的混合引用区域进行累计
7.3.3 引用上期累计结果

第8章 电商平台批量上传产品数据表
8.1 分析现有数据格式及目标表格式
8.1.1 分析目标表和源数据之间的差异
8.1.2 分析数据来源
8.2 导入现有的数据
8.2.1 导入当前表中的数据
8.2.2 导入Excel文件中的数据
8.2.3 导入文件夹中的数据
8.3 合并需要计算的字段
8.3.1 匹配目录ID字段
8.3.2 计算并匹配库存数量
8.3.3 生成产品标题列
8.3.4 合并不需要计算的字段
8.3.5 批量添加自定义列
8.4 按照上传要求修改表格格式
8.4.1 批量修改标题内容
8.4.2 批量选择目标标题列
8.4.3 根据目标表的列排序

第9章 判断是否断码缺货
9.1 定义断码缺货的情况
9.1.1 库存数据源的分析
9.1.2 断码的判断依据
9.2 判断断码缺货的步骤
9.2.1 二维库存表转换成一维表
9.2.2 判断是否符合最小库存数要求
9.2.3 根据要求进行分组计算
9.2.4 判断是否断码的依据
9.2.5 根据条件判断是否缺货
9.2.6 调整数据并加载
9.3 补货需求表的创建
9.3.1 生成补货产品尺码表
9.3.2 获取目前库存数
9.3.3 匹配对应款式要求的最小库存数
9.3.4 计算补货数量
9.3.5 筛选需要补货的尺码明细

第10章 根据指定规则来分隔数据
10.1 Excel中的“分列”功能的使用
10.1.1 批量统一格式
10.1.2 通过分隔符号进行分列
10.1.3 通过固定宽度进行分列
10.2 Power Query中的“拆分列”功能
10.2.1 按分隔符拆分列
10.2.2 按字符数拆分列
10.2.3 按位置拆分列
10.2.4 按照既有规则转换拆分列
10.3 自定义规则转换拆分列
10.3.1 分列函数介绍
10.3.2 自定义字符转换条件
10.3.3 多字符作为分隔符
10.3.4 其他自定义分隔条件

第11章 多行多列数据的清洗方法
11.1 简单重复标题的清洗
11.1.1 多个重复行标题
11.1.2 多个重复列标题
11.2 不一致标题的清洗
11.2.1 左上角标题的处理
11.2.2 不同标题相似格式数据的处理
11.3 带有合并单元格数据的整理
11.3.1 处理上下合并的单元格
11.3.2 处理左右合并的单元格
11.3.3 处理多重标题
11.3.4 多维数据转一维数据
11.3.5 拆分属性标题列
11.3.6 调整最终的格式

第12章 在Power Query中进行时间的计算
12.1 日期和时间类函数的基本介绍
12.1.1 日期和时间类函数之间的计算
12.1.2 日期和时间类函数的主要分类
12.1.3 日期格式的互相转换
12.2 日期和时间类函数的应用
12.2.1 日期格式的转换
12.2.2 按连续日期汇总
12.2.3 针对日期划分排班表
12.3 计算到期日账单
12.3.1 账期的解释
12.3.2 匹配账期
12.3.3 计算到期日
12.3.4 汇总到期日金额
12.3.5 已到期账单及未到期账单

第13章 提取代码中的数据
13.1 带table标签的代码
13.1.1 网页代码的基础知识
13.1.2 源代码结构分析
13.1.3 提取table标签中的数据
13.2 对JSON格式的数据进行清洗
13.2.1 JSON格式的数据简介
13.2.2 JSON格式的转换
13.3 提取代码中的指定数据
13.3.1 导入源代码文件
13.3.2 分析数据所在位置
13.3.3 提取所需数据

第14章 Power Query中的自定义函数
14.1 Power Query中的函数概念
14.1.1 函数的结构
14.1.2 调用查询中的步骤
14.1.3 调用全部查询
14.2 自定义函数的备注
14.2.1 代码的编写格式
14.2.2 代码中的备注
14.2.3 使用元数据进行备注
14.2.4 错误值的备注
14.3 自定义函数实战
14.3.1 函数的目标
14.3.2 完成基本功能
14.3.3 完成多条件需求
14.3.4 设置函数错误提示
14.3.5 函数界面中的说明

第15章 对接人工智能API处理数据
15.1 高德开放平台的API对接
15.1.1 准备阶段
15.1.2 了解对应API的开发文档
15.1.3 创建应用
15.1.4 编写代码
15.2 百度智能云的API对接
15.2.1 准备阶段
15.2.2 了解对应API的开发文档
15.2.3 创建应用
15.2.4 编写代码

读者评论

  • 怎么没有配套资源下载

    wa发表于 2025/2/17 17:05:15