课程: 学习数据分析:1. 基础知识

免费学习该课程!

今天就开通帐号,25,600 门业界名师课程任您挑!

在Power Query中进行数据建模

在Power Query中进行数据建模

有时候,你可能无法访问后端数据库, 或者是使用查询工具对数据进行建模。 这个时候该怎么办呢? 你可以使用 Excel 内置的 Power Query 工具, 它能够将数据导入 Excel, 并且通过合并查询, 根据你的需求对数据进行建模。 比如,我们想结合工资数据和邮政编码信息 来分析数据。 我们现在新建了一个 Excel 工作簿。 首先我们要进入 Power Query。 我们切换到“数据”选项卡, 然后点击“获取数据”按钮, 我们选择“来自文件”, “从 Excel 工作簿”。 接下来,选择要处理的文件。 首先要处理的是邮政编码数据。 我们找到“练习文件”, 打开“0606”下面的“邮政编码数据”。 接下来在导航器中, 选中“邮政编码”工作表。 这个时候我发现,数据有点问题, 因为,邮政编码不应该只有三位数字。 我们点击“转换数据”, 来看一下问题出在什么地方。 在这里我们看到有一列 叫做“文本邮政编码”, 但实际上 Power Query 更改了它的数据类型。 这是因为它在尝试理解你的数据类型, 并且自动创建相应的数据类型。 在这里,我们不需要这种变化, 可以把对应的“更改的类型”这个步骤, 把它删除, 也就是点击前面这个叉。 删除以后, 你就会看到邮政编码前面的 0 又出现了。 为了保留这些前导 0 , 我们需要把这一列更改为文本类型, 还有,我们不需要邮编这一列的数据, 我们可以通过右键菜单把它删除。 最后,点击“关闭并上载”按钮。 我们把邮政编码数据导入到电子表格。 现在你会注意到, 它还保留了邮政编码的前导 0。 因为,它现在是文本类型, 如果是数字, Excel 就会把这个前导 0 删除。 好的,接下来我们来处理下一个数据集。 打开“数据”选项卡, 点击“获取数据”按钮, 选择“来自文件”, “从 Excel 工作簿”, 然后,选中要处理的“工资调查”, 把它导入进来。 我们选中“调查”工作表, 点击“转换数据”按钮。 可以看到, 在数据集中有 343 行调查数据。 首先我们要来检查邮政编码数据。 找到以后,在列标题上点击右键, 选择“移动”, 移到开头, 这样在后面合并的时候就会很方便。 然后,我发现, 这个邮政编码的数据类型是数字类型, 因为在列标题上显示了数字图标。 但是,我们要合并的数据列 必须是相同的数据类型。…

内容