Excel里的“频率分布直方图”分多少组最合适?
“频率分布”,如果让同学们说出它的定义,估计没有多少人可以说出来。但是频率分布却是我们经常接触的内容。
全距:数据集中的最大值和最小值的的差值(也称:极差),全距=Xmax-Xmin,一般用R表示,本例中:
频率分布到底分多少组是合适的。这个问题没有定论,它和数据集的个体多少、数据特点、数据分析的方向等等都有关系。
例如时间分布,如果数据量不多,那就可以划分12组,每两个小时为一组;如果数据量比较多,而且时间间隔比较短,可以每半小时划分一个组,甚至更短的间隔。
公式解析:K为组数、N为数据集内样本的个数、lg是以10为底数的对数,组数肯定是一个“整数”,四舍五入取整即可
组距:每组上限数值和下限数值的间隔距离。它可以用公式d=R/K计算,一般来说这个间距值,会是5或10的倍数。
频数:数据集中样本落在各个分组中的数量次数。可以使用函数FREQUENCY函数计算。
理论上的内容就是上面所述了,下面我们就以上述的数据源,做一个实际应用展示一下这些公式如何使用吧,先展示个效果图,便于大家对下面的讲解有个对照:
1.在A9:A3区域,将30天的数据列在一列,具体方法就看同学们自己会啥了;
LOG函数的第一参数是是真数,第二参数是底数。本例计算底数为10,四则运算后,用ROUND函数进行四舍五入确定组数K值为6
7.在C16单元格输入数值105,作为第一个组的上线值,第一个值的确立就是根据最小极值108口算的,没必要再烧脑做函数了;
8.在C17单元格输入公式:=D16+1,下拉填充至C21单元格,得到所有分组的上限值;
9.在D16单元格输入公式:=C16+$D$13,下拉填充至D21单元格,得到所有分组的下限值;
按CTRL+SHIFT+ENTER组合键,形成数组函数,得到频数分布值;
及此完成对这组数据的一个频率分布的统计工作,最后我们配上一个“频率分布直方图”,这份数据分析不就“挠儿挠儿”的了吗?
虽然直方图是柱形图组合折线的做法,但属于数据分析的范畴,它和各个系列单纯的数据对比不一样,它可以建立频数、频率分布,从而较好的反映出数据的分布状态,对于公司经营的指标参数指定有这不可替代的作用。希望通过本期教程,你可以学到知识哟!