在我们要做数据分析之前 , 首先要了解数据分析有哪些步骤 。
数据分析一般分为5个步骤:
- 明确问题
- 理解数据
- 数据清洗
- 数据分析或构建模型
- 数据可视化
EXCEL作为数据分析工作中最常用的软件 , 是我们在入门数据分析首先要学的工具 , 今天我们就以EXCEL的使用为例 , 看看如何做到基础的数据分析工作 。
一、数据分析第1步:明确问题
假设我们手头上有一份招聘网站的招聘数据 , 我们想要了解一些问题:
- 在哪些城市找数据分析工作机会更大?
- 数据分析师的薪资水平怎么样?
- 不同的工作经验 , 薪酬水平有怎样的变化情况?
我们在拿到收集数据的文件之后 , 需要养成良好的工作习惯 , 对原始数据文件进行备份 , 然后再在文档上对数据进行理解、清晰、分析等工作 。
1.了解数据有什么信息
我们打开数据文件 , 我们会看到会有很多的列明(字段) , 例如城市、公司名称、职位福利、薪水等 , 而这些信息正是意味着我们可以通过这份数据可以让我们了解到什么情况 , 或者可以用来解决什么问题 。
很多时候我们拿到一份EXCEL文档 , 会发现很多个格子的信息都显示不全 , 这种时候我们可以点击任意一个信息 , 然后键盘CTR+A全选数据 , 然后点击”开始”栏的自动换行 。
这时信息就显示全了 , 那么想要让表格更加美观一点呈现信息的话 , 我们可以点击表格的左上角的小三角形 , 这时候会全选整个表格 , 接着再列号位置点击右键(A/B/C/D……这种) , 然后点击列宽 , 试着设置为15 , 这时表格会变宽 。
2.了解EXCEL的数据类型
EXCEL的数据类型主要分为三种类型 , 分别是字符串、数值、逻辑 。
数字可以是两种类型 , 一种是字符串类型 , 字符串类型的数字不能用于计算 , 一般在表格中默认向左对齐;而数值类型的数字则可以用于计算 , 一般在表格中默认向右对齐 。
三、数据分析第3步:数据清洗
数据清洗占用我们数据分析中大部分的时间 , 数据清洗相当于把数据改变我们喜欢的样子、符合我们需求的样子 , 为后续的分析工作做准备 。