分散計算ツール - 標本・母集団分散

任意のデータセットの分散、標準偏差、平均値、中央値、最頻値、IQRを計算 — 標本式か母集団式を選択できます。

カンマまたは空白で区切った数値を入力し、標本または母集団を選ぶだけで、完全な統計サマリーをすぐに取得できます。

分散計算ツール - 標本・母集団分散
任意のデータセットの分散、標準偏差、平均値、中央値、最頻値、IQRを計算 — 標本式か母集団式を選択できます。

分散計算ツールについて

分散は、各データ点とデータセットの平均値との差の二乗の平均であり、分布の散らばり具合を数値化します。分散が0ならすべての値は同じで、分散が大きいほど平均のまわりに広く散らばっています。分散は二乗単位で表されるため、その平方根である標準偏差のほうが直感的に感じられることが多いですが、分散自体は加法性を持ち、多くの高度な手法の基礎になるため、統計理論では不可欠です。 この分散計算ツールは、本質的に異なる2つの用途を区別します。母集団分散(σ²)は、二乗偏差の合計を n、つまり値の総数で割ります。これは、たとえばあるクラスの全生徒の身長のように、記述したい完全な母集団に使います。標本分散(s²)は n − 1 で割り、ベッセル補正を適用します。これは、標本平均が推定値であるため、母集団の散らばりをわずかに過小評価してしまう点を補正するためです。有限標本では、補正後の値は常に未補正値より少し大きくなります。より大きな集団から抽出した標本であれば、標本分散が標準的な選択です。 分散に加え、このツールは記述統計の完全な要約も算出します。平均値は算術平均、つまり合計を件数で割った値です。中央値は並べ替えたデータの中央の値で、件数が偶数の場合は中央2値の平均になります。外れ値に強く、偏った分布では平均値より有用なことがよくあります。最頻値は最も頻繁に現れる値(複数可)で、すべての数値が1回ずつしか現れない場合は最頻値なしと表します。範囲は最大値と最小値の差です。四分位範囲(IQR)はデータの中央50%の広がりで、第25パーセンタイルから第75パーセンタイルまでを表し、箱ひげ図の外れ値検出にも特に役立ちます。 分散とその仲間である標準偏差、IQR、範囲は、あらゆるデータ分析の場面で使われます。品質エンジニアは分散で生産の安定性を監視し、仕様から外れたロットを検出します。投資アナリストは分散をポートフォリオのボラティリティ指標として使い、リターンの分散が大きいほど資産のリスクは高くなります。教育現場では、テスト結果が狭くまとまっているか(低分散で安定)、それともばらついているか(高分散で理解に差があるか)を確認するために使います。疫学者は疾病発生の地域分布を特徴づけるために母集団分散を使い、社会科学者は人口統計グループ間の不平等を比較するために使います。 このツールは、整数、小数、正の数、負の数を含む任意の数値リストを扱え、すべての統計量を一度に計算します。非常に大きい値や非常に小さい値は、読みやすさと精度のバランスを取るために、有効数字6桁まで表示されます。

分散計算ツールの例

異なるデータ分布で分散がどう変わるかを示す3つの例です。

データセット分散詳細
標本: 85, 92, 78, 88, 95, 81, 74s² ≈ 57.247人の学生のテスト点。平均 ≈ 84.71、s ≈ 7.57。平均のまわりの散らばりは中程度です。
母集団: 25, 32, 28, 45, 38, 29, 33, 51σ² ≈ 70.36ある部署の全8人の年齢。平均 = 35.125、σ ≈ 8.39。45と51の2つの外れ値により分散が高くなっています。
標本: 250.5, 252.1, 249.8, 255.3, 254.7, 251.9, 253.2, 256.0s² ≈ 5.108日分の株の終値。平均 ≈ 252.94、s ≈ 2.26。低分散で、価格はかなりまとまっています。

分散計算ツールの使い方

  1. データ欄に数値を入力または貼り付けます。区切りはカンマ、空白、改行のいずれでも構いません。
  2. より大きな母集団の一部なら「標本」を、全体を含むなら「母集団」を選びます。
  3. [計算]をクリックすると、分散、標準偏差、平均値、中央値、最頻値、IQR、範囲を計算します。
  4. 「分散」行で二乗された散らばりを、「標準偏差」行で同じ散らばりを元の単位で確認できます。
  5. [リセット]で入力をすべて消去して新しい計算を始めるか、例を読み込んで実際のデータセットを確認できます。

分散計算ツールのFAQ

分散とは何ですか?何を測りますか?
分散は、数値の集合が平均値のまわりでどの程度散らばっているかを測ります。各値と平均値の差の二乗の平均として計算されます。分散が高いほど散らばりが大きく、分散が0ならすべての値が同じです。
標本分散と母集団分散の違いは何ですか?
母集団分散は n で割り、データがグループ全体を含む場合に使います。標本分散は n − 1 で割り(ベッセル補正)、より大きな母集団から抽出した一部分のデータに使います。この補正により、真の母集団の散らばりを過小評価しないようにします。
分散と標準偏差はどう関係していますか?
標準偏差は分散の平方根です。分散は二乗単位(例: 2乗ドル、2乗キログラム)なので、直接は解釈しづらいことがあります。平方根を取ると元の単位に戻るため、多くの比較では標準偏差のほうが直感的です。
いつ分散を標準偏差の代わりに報告すべきですか?
理論的な研究や、ANOVA、回帰、ポートフォリオ理論のように加法性が重要な手法では分散が好まれます。独立変数の和の分散は、それぞれの分散の和に等しいためです。一般向けには、データと同じ単位で表せる標準偏差のほうが散らばりを伝えやすいです。
IQR が高い、または低いと何を意味しますか?
IQR はデータの中央50%の範囲です。IQR が小さいほど中心値は密集しており、IQR が大きいほど散らばっています。極端な外れ値を無視するため、分散や標準偏差より頑健です。
分散は負になりますか?
いいえ。分散は二乗項の合計を正の数で割るので、必ず0以上です。分散が0なら、データセット内のすべての値が同じです。どこかで負の結果が出るなら、計算ミスです。