统计中的直方图分布是指一个直方图上的单变量数据条的模式、形状和位置,如何分布和分布在哪里可以用来分析和得出有关数据的结论,直方图分布分析对于识别数据的正态性等特征很重要,多模态分布和倾斜数据。 手放在臀部的...
统计中的直方图分布是指一个直方图上的单变量数据条的模式、形状和位置,如何分布和分布在哪里可以用来分析和得出有关数据的结论,直方图分布分析对于识别数据的正态性等特征很重要,多模态分布和倾斜数据。

手放在臀部的女性
直方图是一种单变量数据显示,使用面积与类或二进制频率成比例的矩形直观显示数据特征。直方图中的数据点是直方图分布本身是对数据的频率分布或概率密度函数的直观近似,分布的形状可以根据数据的个数而变化。
直方图分布分析通常被用作对数据正态性。虽然存在确定正态性的分析方法,但直方图可用于提供快速的常识性检查,以节省时间。如果直方图数据看起来大致均匀且以平均值为中心,则假定数据为正态。尽管速度快且相对容易,这种定性检查是主观的,如果需要更高的准确度标准,则应使用分析方法。
确定数据集是否存在偏斜是使用直方图分布分析的另一种方法。数据偏斜定义为数据中明显的不对称性。负偏斜或向左偏斜,在低值很少的数据集中可见。在高值很少的数据集中出现正偏斜或向右偏斜。观察直方图分布可以显示异常值和偏斜数据
除了用单一模式揭示数据的特征外,直方图的形状还可以揭示多模式数据的特征。多模式数据集包含多个模式,其特征是具有多个峰值或最大值的频率分布。一个城镇的政治派别,认可度民意测验和蜜蜂体型是可能是多模态数据集的例子。观察直方图的形状并注意多模态数据中的各种峰值通常比简单的单变量统计计算更能为研究人员提供洞察。
直方图分析和数据分布很大程度上取决于所选的箱子大小。在实践中,尽管可以使用其他箱子大小,但可以通过观察数量的平方根来估计箱子的数量。例如,教师可以选择反映字母等级的箱子大小来分析考试成绩。