標準偏差計算機とは?
標準偏差計算機は、数値の集合が平均の周りにどれだけ散らばっているかを測定します。データ点を入力すると、計算機はデータ数、平均、分散、標準偏差を瞬時に報告します。これはデータの母集団としての解釈と標本としての解釈の両方について求められます。標準偏差が小さいほど値が平均の周りに密集していることを意味し、大きいほど広く散らばっていることを意味します。
標準偏差は、統計学で最も広く使われる散らばりの尺度の一つです。品質管理や金融(しばしばボラティリティと呼ばれます)から、テスト得点の分析や科学研究に至るまで、あらゆる場面で登場します。なぜなら、ばらつきを元のデータと同じ単位で表すからです。
母集団と標本
分散と標準偏差には密接に関連する 2 つの版があり、正しいものを選ぶことが重要です。
- 母集団の統計量は、完全なデータ集合を記述します。あなたが対象とするすべての要素が含まれます。母分散は二乗偏差の和をデータ数 で割り、その記号は (分散)と (標準偏差)です。
- 標本の統計量は、より大きな母集団から抽出された小さな部分集合を記述します。あなたは標本からその母集団全体の散らばりを推定したいわけです。標本分散は ではなく で割り(これはベッセルの補正として知られています)、未知の真の平均ではなく標本平均を用いることで生じるバイアスを補正します。その記号は (分散)と (標準偏差)です。
より小さい で割るとわずかに大きい結果になるため、同じデータに対して標本標準偏差は常に母標準偏差以上になります。標本版には少なくとも 2 つのデータ点が必要です。値が 1 つだけでは推定すべき散らばりがありません。
どのように計算しますか?
母標準偏差は、各値の平均からの距離の二乗の平均の平方根です。
ここで は母平均、 は値の個数です。標本標準偏差は標本平均 を用い、 で割ります。
計算は次の 4 つの手順に従います。
- すべての値を足し、その個数で割って平均を求めます。
- すべての値から平均を引いて各偏差を求めます。
- 各偏差を二乗し、それらの二乗を足し合わせます。
- (母集団)または (標本)で割り、次に平方根をとって標準偏差を得ます。平方根を省くと分散が残ります。
計算例
データ集合 を考えます。これは 個の値を持ちます。
まず、平均は次のとおりです。
次に、平均 からの二乗偏差は で、その和は です。母分散と母標準偏差は次のとおりです。
同じ数値を標本として扱う場合は、二乗和を で割ります。
予想どおり、標本標準偏差 は母標準偏差 より大きくなります。
のようなより小さい集合では、平均は 、二乗偏差の和は 、母標準偏差は 、標本標準偏差は です。
実用上の注意
数値が分析対象のグループ全体を表す場合は母集団の公式を使います。たとえば、あるクラスがあなたの関心のすべてであるとき、その単一クラスの全生徒のテスト得点がこれにあたります。数値がより大きなグループについて何かを推測するために用いられる部分集合である場合は標本の公式を使います。これは調査、実験、そしてほとんどの実世界の統計でよくある場合です。
標準偏差は平均や、信頼区間のような区間推定と自然に組み合わさります。信頼区間は標準偏差と標本サイズを用いて真の平均を区切ります。また、仮説検定で用いられる臨界値の基礎にもなっています。
よくある質問
分散と標準偏差の違いは何ですか?
分散は平均からの二乗偏差の平均で、二乗された単位で表されます。標準偏差は分散の平方根で、尺度をデータの元の単位に戻し、解釈しやすくします。
母標準偏差と標本標準偏差のどちらを使うべきですか?
データが対象とするグループ全体を網羅している場合は、母集団版(、 で割る)を使います。データがより大きな母集団からの標本であり、その母集団の散らばりの不偏推定値が欲しい場合は、標本版(、 で割る)を使います。
標準偏差はゼロや負になり得ますか?
ゼロになり得ます。これはデータ集合のすべての値が同一である場合にのみ起こり、散らばりがありません。負になることは決してありません。なぜなら、それは二乗された(非負の)項の和の平方根だからです。