什么是置信区间?
置信区间是未知总体参数(此处为总体均值)的一组合理取值范围。它不报告单一的点估计,而是通过下界和上界来表达该估计的不确定性。
例如,95% 置信区间意味着如果你多次重复相同的抽样过程,所构造的区间中约有 95% 会包含真实均值。区间的宽度取决于数据的变异程度、观测的数量以及你希望达到的把握程度。
本计算器使用 z(正态)近似,当总体标准差已知或样本足够大以使中心极限定理成立时,该方法是适用的。
计算器如何工作?
你需要提供四项信息:
- 样本均值 (x̄):观测值的平均数。
- 标准差 (σ):数据的离散程度;必须为正。
- 样本量 (n):观测的个数;不小于 1 的整数。
- 置信水平:你希望达到的把握程度:90%、95% 或 99%。
每个置信水平对应一个临界 z 值:
| 置信水平 | z 值 |
|---|---|
| 90% | 1.645 |
| 95% | 1.960 |
| 99% | 2.576 |
计算器返回误差范围、下界和上界。
公式
均值的标准误为:
误差范围将标准误按临界 z 值缩放:
于是均值的置信区间为:
计算示例
示例 1:x̄ = 100,σ = 15,n = 36,95%
标准误为:
当 z = 1.96 时,误差范围为:
因此 95% 置信区间为 [95.1, 104.9]。
示例 2:x̄ = 50,σ = 10,n = 25,99%
标准误为:
当 z = 2.576 时,误差范围为:
因此 99% 置信区间为 [44.848, 55.152]。
实用说明
- 更高的置信水平会使区间变宽:要更有把握地涵盖真实均值,就需要更大的范围。
- 更大的样本量会使区间变窄,因为标准误随 √n 减小。
- z 近似假设均值的抽样分布近似正态。对于标准差未知的小样本,t 区间通常更精确。
- 误差范围是对称的,因此区间始终以样本均值为中心。