什么是标准差计算器?
标准差计算器衡量一组数字围绕其均值的离散程度。输入你的数据点,计算器会即时给出个数、均值、方差和标准差——既包括对数据的总体解释,也包括样本解释。标准差小意味着数值紧密地聚集在平均数附近;标准差大意味着它们分布得很分散。
标准差是统计学中最常用的离散程度度量之一。从质量控制和金融(在那里常被称为波动率)到考试成绩分析和科学研究,它无处不在,因为它用与原始数据相同的单位来表达变异性。
总体与样本
方差和标准差有两个密切相关的版本,选择正确的那个很重要。
- 总体统计量描述一个完整的数据集——你所关心的每个成员都包含在内。总体方差将偏差平方和除以个数 ,其符号为 (方差)和 (标准差)。
- 样本统计量描述从更大总体中抽取的较小子集,而你想根据样本来估计整个总体的离散程度。样本方差除以 而非 (这被称为贝塞尔校正),用以校正因使用样本均值而非未知真实均值所产生的偏差。其符号为 (方差)和 (标准差)。
由于除以较小的 会得到略大的结果,对于相同的数据,样本标准差总是大于或等于总体标准差。样本版本至少需要两个数据点;只有一个值时没有可估计的离散程度。
它是如何工作的?
总体标准差是每个值与均值之距离的平方的平均数的平方根:
其中 是总体均值, 是值的个数。样本标准差使用样本均值 并除以 :
计算遵循四个步骤:
- 把所有值相加并除以其个数,求出均值。
- 从每个值中减去均值,求出每个偏差。
- 将每个偏差平方,并把这些平方相加。
- 除以 (总体)或 (样本),然后取平方根得到标准差。跳过平方根则得到的是方差。
计算示例
考虑数据集 ,它有 个值。
首先,均值为:
接着,相对于均值 的偏差平方为 ,其和为 。总体方差和总体标准差为:
若把同样的数字当作样本处理,将平方和除以 :
正如预期,样本标准差 大于总体标准差 。
对于像 这样较小的集合,均值为 ,偏差平方和为 ,总体标准差为 ,样本标准差为 。
实用说明
当你的数字代表你正在分析的整个群体时,使用总体公式——例如,当某个班级就是你全部关心的对象时,该单个班级中每位学生的考试成绩。当你的数字是用来推断更大群体的某个子集时,使用样本公式,这是调查、实验和大多数现实统计中的常见情形。
标准差与平均数以及诸如置信区间之类的区间估计自然相配,置信区间利用标准差和样本量来界定真实均值。它也是假设检验中所用临界值的基础。
常见问题
方差和标准差有什么区别?
方差是相对于均值的偏差平方的平均数,以平方单位表示。标准差是方差的平方根,它将该度量还原到数据的原始单位,使其更易于解释。
我应该使用总体标准差还是样本标准差?
当你的数据涵盖整个所关心的群体时,使用总体版本(,除以 )。当你的数据是来自更大总体的样本,并且你想得到该总体离散程度的无偏估计时,使用样本版本(,除以 )。
标准差可以为零或为负吗?
它可以为零,这仅在数据集中每个值都相同时发生——没有离散。它永远不会为负,因为它是平方(非负)项之和的平方根。