课程: 学习数据分析:1. 基础知识

免费学习该课程!

今天就开通帐号,25,300 门业界名师课程任您挑!

维护原始数据

维护原始数据

在理想的情况下, 我们希望从系统中获得高质量的数据集, 但是现实往往不是这样。 我们可能只会收到一个电子表格, 或者是只能有限制地导出数据。 有时候我们会收到一个 CSV 文件。 保留导出的或是接收到的原始数据非常重要, 因为它可以在重置工作的时候节省时间, 不需要我们每次都重新开始, 并且还可以提供审计追踪记录。 我们来看一个实际的例子。 假如你没有权限直接运行 生成月报记录集的查询, 而是需要通过数据库管理员 或者是 IT 部门获取, 他们负责运行查询并且发送给你。 你需要对数据进行清理、制作报表, 每个月提交给团队。 在这种情况下,我建议把收到的文件 存放在一个专用文件夹中,以备日后查询, 不要只依赖电子邮件作为数据来源。 通常呢,我会先创建一个原始数据文件夹。 现在我要在 04_05 这个文件夹中, 去创建这个文件夹。 点击右键, 选择“新建”,然后选择“文件夹”, 我们把它起名为"原始数据"。 这样,一旦打开这个文件夹, 我就立刻知道原始数据在这里。 你可能已经注意到了,在当前的文件夹中 有一个员工数据,它是一个 CSV 文件。 选中这个文件, 然后我要把它拖动到 “原始数据”文件夹里面。 现在我们打开原始数据文件夹。 为了防止不小心修改文件, 我要把这个文件设置为只读。 右键点击这个文件, 然后选择“属性”。 我们勾选上“只读”, 然后点击“确定”, 点击“确定”。 接下来, 我要给这个文件创建一个工作副本, 我们打开这个文件, 我们刚才谈到它是一个 CSV 文件, 并且呢,当前是处于只读状态。 我们可以使用快捷键 F12。 这样,我们就可以快速打开,另存为对话框。 我们把它保存到上一级文件夹, 把它重命名为“员工数据_工作文件”, 我们中间加一个下划线, 因为 CSV 文件是逗号分隔的值文件, 它不支持创建多个工作表、数据透视表, 或者是图表, 所以呢,我要把它保存为 “Excel 工作簿”, 然后点击“保存”。 接下来,我们需要确认一下 文件菜单中的“信息”选项, 这里没有只读提示。 好的,没有问题, 我们点击后退。 这样,我们就有了原始文件和工作副本。 这些简单的技巧可以节省很多的时间, 避免你在某些情况下不得不重新开始工作。 当老板看到这些数据的时候, 他们可能才会突然想起来 所有之前忘记问你的事情, 这主要是因为人们需要首先看到一些数据,…

内容