19、直方图的柱体不仅能够量度被计量事物的数目(频数),还能体现各个区间所代表的整个数据集的百分比 。
20、下面这些指令会让你对手头的数据集了解更深,还能得知人们的加薪分布 。
sd(data$received)summary(data$received)
sd指令返回指定数据范围的标准偏差,summary()指令显示received(实际加薪)列的汇总统计值 。
21、直方图很好地体现了平均值(mean)、中间值(median)和标准偏差 。通过观察直方图,虽然无法看出具体的数值,但可以形成对数字的感觉 。
22、如果直方图是对称的,则平均值和中间值会处于相同的位置——正中间 。但在这个实例中,右侧的小峰将平均值拖离大峰的中心,而大部分观察对象都位于这里 。也许我们该重新看看先前划分的数据块,弄清楚这些数据块是否和直方图有些关系 。
04 用数据的子集绘制直方图23、用数据的子集绘制直方图 。
hist(data$received[date$year == 2007], breaks = 50)
这个直方图仅选择了2007年的加薪数据,基本形状与原来的直方图相同,坐标则有区别——例如最大的数据块中仅有8个人 。但由于形状相同,2007年的群体可能与整个群体有相同的特性 。
24、2008年情况与使用2007年数据时完全一样,R甚至选用完全一样的坐标绘制数据 。
hist(data$received[data$year == 2008], breaks = 50)
25、尽管这个直方图的坐标有所不同,我们却再一次看到一个大峰和一个挨在大峰右边的小峰,这个图形显示出女性在这些年里的加薪情况,因此人数众多 。
hist(data$received[data$gender == “F”], breaks = 50)
26、这个图形看起来非常像女性的加薪直方图 。虽然坐标不同,但只要分析一下柱体,就能看出不同区间中的男性和女性的数目大致相同 。像前面一样,这个图有两个峰 。
hist(data$received[data$gender == “M”], breaks = 50)
27、有趣的事情出现了:只有一个峰 。横坐标表明这些人(即未提出加薪的人)处于加薪范围的低端;纵坐标表明这些人为数众多 。
hist(data$received[data$negotiated == FALSE], breaks = 50)
28、看来,把提过加薪要求和未提过加薪要求的人拆开后,两个峰会明显分离,我们看到:人员加薪大增,同时人数锐减 。似乎要求加薪的人会在结果分布图上呈现完全不同的分布形态 。
hist(data$received[data$negotiated == TRUE], breaks = 50)
推荐阅读
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- 怎么做茄子烧肉
- 冰箱停电了食物臭了怎么处理
- 转轮电话怎么用
- 徐州烙馍怎么做
- 外卖车被撞变形了保险怎么处理
- 雪佛兰迈锐宝xl胎噪怎么解决
- 汉兰达怎么和手机互联
- 君威定速巡航怎么开
- 宝马x1后排座椅怎么放倒
- 大众凌渡后视镜怎么调教程