"这份PDF教程是关于Power Query M函数的高级篇,主要涵盖了在处理表格数据时的一些核心函数和操作,包括取单列和多列、展开List和Record等复杂操作。"
在Power Query M中,对表格进行操作是数据分析的基础。教程首先介绍了如何选取表格中的列:
1. 获取单列:`Table.Column(表, "字段名")` 是一种方法,但在实际使用中,通常直接使用 `源[字段名]` 的形式来引用列。
2. 获取多列:
- 单列:`Table.SelectColumns(源, "字段名")` 可以被 `源[字段名]` 替换。
- 多列:`Table.SelectColumns(源, {"字段名1", "字段名2"})` 返回一个新的表,仅包含指定的列。如果提供第三个参数,如 `Table.SelectColumns(源, {"字段名1", "字段名2"}, 1)`,可以设置错误处理方式,例如忽略错误。
接下来,教程讲解了如何展开List列的内容:
1. `Table.ExpandListColumn(表, "列表列名")` 函数用于将包含列表的列拆分为多行,每行对应列表中的一个元素,其他列的值在所有新行中保持不变。例如,一个包含多个姓名的列表会被扩展成多行,每行一个姓名。
然后,教程介绍了如何展开Record列:
1. `Table.ExpandRecordColumn(表, "记录列名", {"字段名1", "字段名2"}, {"新字段名1", "新字段名2"}` 这个函数用于展开Record类型列,并可以选择重命名展开后的字段。如果Record中不存在指定的字段,系统会添加一个空字段。只指定一个字段名则只会展开一个字段。
这些高级技巧在处理复杂的数据结构时非常有用,尤其是在数据预处理阶段,能够有效地整理和重塑数据。例如,当数据源中存在嵌套的列表或记录时,`Table.ExpandListColumn` 和 `Table.ExpandRecordColumn` 可以帮助将这些复杂结构转化为易于分析的格式。通过熟练掌握这些M函数,用户能够更高效地清洗、转换和聚合数据,从而提升数据处理的能力和效率。