统计学

标准差计算器

设置
重置
分享结果
保存
嵌入
报告错误

分享计算器

将我们的免费计算器添加到您的网站

请输入有效的 URL。仅支持 HTTPS URLs。


将页面上计算器输入字段中的当前值用作嵌入计算器的默认值。


输入框边框聚焦颜色,开关框选中颜色,选择项悬停颜色等。


请同意使用条款。

预览

保存计算器

计算器设置

请输入在允许范围内的值。

请输入在允许范围内的值。

请输入在允许范围内的值。

请输入在允许范围内的值。

分享计算器

什么是标准差计算器?

标准差计算器衡量一组数字围绕其均值的离散程度。输入你的数据点,计算器会即时给出个数、均值、方差和标准差——既包括对数据的总体解释,也包括样本解释。标准差小意味着数值紧密地聚集在平均数附近;标准差大意味着它们分布得很分散。

标准差是统计学中最常用的离散程度度量之一。从质量控制和金融(在那里常被称为波动率)到考试成绩分析和科学研究,它无处不在,因为它用与原始数据相同的单位来表达变异性。

总体与样本

方差和标准差有两个密切相关的版本,选择正确的那个很重要。

  • 总体统计量描述一个完整的数据集——你所关心的每个成员都包含在内。总体方差将偏差平方和除以个数 NN,其符号为 σ2\sigma^2(方差)和 σ\sigma(标准差)。
  • 样本统计量描述从更大总体中抽取的较小子集,而你想根据样本来估计整个总体的离散程度。样本方差除以 n1n - 1 而非 nn(这被称为贝塞尔校正),用以校正因使用样本均值而非未知真实均值所产生的偏差。其符号为 s2s^2(方差)和 ss(标准差)。

由于除以较小的 n1n - 1 会得到略大的结果,对于相同的数据,样本标准差总是大于或等于总体标准差。样本版本至少需要两个数据点;只有一个值时没有可估计的离散程度。

它是如何工作的?

总体标准差是每个值与均值之距离的平方的平均数的平方根:

σ=1Ni=1N(xiμ)2\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N} (x_i - \mu)^2}

其中 μ\mu 是总体均值,NN 是值的个数。样本标准差使用样本均值 xˉ\bar{x} 并除以 n1n - 1

s=1n1i=1n(xixˉ)2s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n} (x_i - \bar{x})^2}

计算遵循四个步骤:

  1. 把所有值相加并除以其个数,求出均值
  2. 从每个值中减去均值,求出每个偏差
  3. 将每个偏差平方,并把这些平方相加。
  4. 除以 NN(总体)或 n1n - 1(样本),然后取平方根得到标准差。跳过平方根则得到的是方差。

计算示例

考虑数据集 2,4,4,4,5,5,7,92, 4, 4, 4, 5, 5, 7, 9,它有 N=8N = 8 个值。

首先,均值为:

μ=2+4+4+4+5+5+7+98=408=5\mu = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = \frac{40}{8} = 5

接着,相对于均值 55 的偏差平方为 9,1,1,1,0,0,4,169, 1, 1, 1, 0, 0, 4, 16,其和为 3232。总体方差和总体标准差为:

σ2=328=4σ=4=2\sigma^2 = \frac{32}{8} = 4 \qquad \sigma = \sqrt{4} = 2

若把同样的数字当作样本处理,将平方和除以 n1=7n - 1 = 7

s2=3274.5714s=4.57142.1381s^2 = \frac{32}{7} \approx 4.5714 \qquad s = \sqrt{4.5714} \approx 2.1381

正如预期,样本标准差 2.13812.1381 大于总体标准差 22

对于像 1,2,3,4,51, 2, 3, 4, 5 这样较小的集合,均值为 33,偏差平方和为 1010,总体标准差为 21.4142\sqrt{2} \approx 1.4142,样本标准差为 2.51.5811\sqrt{2.5} \approx 1.5811

实用说明

当你的数字代表你正在分析的整个群体时,使用总体公式——例如,当某个班级就是你全部关心的对象时,该单个班级中每位学生的考试成绩。当你的数字是用来推断更大群体的某个子集时,使用样本公式,这是调查、实验和大多数现实统计中的常见情形。

标准差与平均数以及诸如置信区间之类的区间估计自然相配,置信区间利用标准差和样本量来界定真实均值。它也是假设检验中所用临界值的基础。

常见问题

方差和标准差有什么区别?

方差是相对于均值的偏差平方的平均数,以平方单位表示。标准差是方差的平方根,它将该度量还原到数据的原始单位,使其更易于解释。

我应该使用总体标准差还是样本标准差?

当你的数据涵盖整个所关心的群体时,使用总体版本(σ\sigma,除以 NN)。当你的数据是来自更大总体的样本,并且你想得到该总体离散程度的无偏估计时,使用样本版本(ss,除以 n1n - 1)。

标准差可以为零或为负吗?

它可以为零,这仅在数据集中每个值都相同时发生——没有离散。它永远不会为负,因为它是平方(非负)项之和的平方根。

报告错误

此字段为必填项。