课程: 学习数据分析:1. 基础知识

免费学习该课程!

今天就开通帐号,25,600 门业界名师课程任您挑!

使用平面文件

使用平面文件

有时候, 我们无法直接连接数据库系统的后端, 只能使用导出的数据, 比如 Excel 或者是 CSV 文件。 这类文件称作是平面文件, 它们已经和数据库脱离了联系。 也就是说, 你不能让它们和存储数据的系统进行连接。 当系统中的数据更新时, 平面文件中的数据不会同步更新。 你要想获取新的内容, 你还需要更新文件来获取数据变更。 CSV 是一种常见的平面文件格式, 它的字面意思就是逗号分隔的值。 在 CSV 文件中,逗号作为分隔符 将各个列隔开。 除此以外,还有其他类似的平面文件格式, 比如制表符分隔的, 或者是固定宽度分隔的文件。 固定宽度就是指 通过一定数量的空格来进行分隔。 通常,我们会使用 Excel 来打开 CSV 文件。 很多人选择 Excel 作为数据处理工具, 是因为他们收到的数据邮件 就是 Excel 格式, 所以选择 Excel 的理由显而易见。 但是,他们可能没有充分地利用 Excel 中的工具, 比如 Power Query 工具, 来提高他们的工作效率。 有时候,你会收到一个完整的数据表, 里面包含了制作报表需要的所有数据。 下一次你收到的文件, 可能会在这个数据表的基础之上 增加了一些新的数据。 你可以更新手头的文件, 把新的数据加入进来, 也可以利用宏或者是其他操作, 把数据更改合并到文件中。 不过, 比起这种使用复制粘贴的手动方法, 我更想推荐一种简便的方案, 也就是利用 Power Query 工具。 现在, 打开练习文件所在的文件夹“05_03”, 你会看到这里有两个文件, “研究项目_3月”, 和“研究项目_3月4月”, 它们都是 CSV 文件。 我们先收到的 3 月的文件。 如果以图标查看, 你会看到文件图标中 有个小写的字母“a,”, 说明它是一个逗号分隔的值文件。 下个月我会收到一个新的数据文件, 里面包含了 3 月和 4 月的数据。 如果不用 Power Query, 我们可能会打开新收到的文件, 将 4 月份的数据, 复制并且粘贴到 3 月份的文件中, 因为我们不想重新地创建报表, 但是我们还有一个更好的方法 来处理这种情况。 我们在 Excel 中 新建了一个空白工作簿, 然后切换到“数据”选项卡, 点击“获取数据”按钮, 选择“来自文件”, 然后选择“从文本/CSV”。 在练习文件中, 我们选中 3…

内容