Power Query基础教程:数据拆分与类型转换

5星 · 超过95%的资源 需积分: 33 13 下载量 99 浏览量 更新于2024-07-18 5 收藏 597KB DOCX 举报
"本资源主要介绍了Power Query的基础应用,包括数据拆分、转换数据类型以及添加自定义列等核心操作。通过学习,用户可以更好地理解和处理数据,提升数据清洗和预处理的效率。" 在微软的Power Query中,数据拆分、数据类型转换和添加自定义列是至关重要的步骤,对于数据预处理和分析起着关键作用。 1. 数据拆分: 数据拆分是将一个列的内容依据特定规则分解成多个列的过程。这在处理复杂数据时非常有用,例如,如果一列包含多个信息,如“姓名-部门”,可能需要将其拆分为“姓名”和“部门”两列。在Power Query中,可以通过“转换”选项卡下的“拆分列”命令来实现。拆分方式多样,可以基于分隔符、固定宽度或其他自定义规则。 2. 转换数据类型: 确保数据类型正确是数据分析的基础。Power Query中的“转换”选项卡提供了“数据类型”命令,允许用户将选定的列转换为适当的类型,如数字、日期时间、文本、逻辑或二进制等。使用`Table.TransformColumnTypes`函数可以批量修改列的数据类型,其语法要求提供表格、要转换的列名和对应的新数据类型。 例如,若要将“号段.1”和“号段.2”列都转换为整数类型,可以编写以下代码: ```text Table.TransformColumnTypes(按分隔符拆分列,{{"号段.1", Int64.Type}, {"号段.2", Int64.Type}}) ``` 3. 添加自定义列: 自定义列功能允许用户根据需要创建新的列,并可以填充计算或基于其他列的值。在“添加列”选项卡下,选择“自定义列”会打开一个对话框,这里可以设定新列的名称和计算公式。`Table.AddColumn`函数是用于实现这一功能的关键,它接受表格、新列名、生成新列的函数和可选的列类型作为参数。 例如,如果需要创建一个新的列,名为“总和”,其值为“号段.1”和“号段.2”的和,可以这样写: ```text Table.AddColumn(按分隔符拆分列, "总和", each [号段.1] + [号段.2], type number) ``` 以上操作都是在Power Query的查询编辑器中进行,该编辑器提供了强大的M语言支持,使用户能够编写复杂的计算和转换逻辑。 Power Query通过这些基本操作提供了强大的数据预处理能力,让数据清洗和整理变得更加高效和灵活。无论是处理企业级大数据还是个人项目,掌握这些技能都将极大地提升数据工作的质量和效率。