度数分布計算機 - 表を作成

どんなデータセットからでも完全な度数分布表を作成。階級区間、度数、相対度数、累積度数、主要な要約統計量をすぐに取得できます。

数値をカンマ、スペース、または改行で区切って貼り付けるか入力し、階級数を選んで[計算]をクリックすると、度数表と要約が生成されます。

度数分布計算機
データを階級区間にまとめ、度数と統計量を算出

数値はカンマ、スペース、改行で区切れます。

度数分布計算機について

度数分布とは、各値——または値の範囲——がデータセットにどれだけ現れるかを示す表形式の要約です。生データを扱いやすい数の階級区間に整理し、それぞれの区間に入る観測値を数えることで、無秩序な数値の並びを、データの形・中心・ばらつきを示す構造化された姿に変えます。度数分布は記述統計の基礎概念であり、ヒストグラム、相対度数多角形、累積度数曲線の基礎にもなります。 グループ化された度数分布では、データの範囲を、重ならない等幅の階級区間に分割します。各区間には下限、上限、階級値があります。度数はその区間に入るデータ点の数です。相対度数は、度数を全体に対する割合(またはパーセント)で表したもので、サイズの異なるデータセット同士の比較をしやすくします。累積度数は、最初の階級から現在の階級までの度数の累計で、各階級境界以下にいくつのデータ点があるかを示します。 階級数の選択はバランスが重要です。少なすぎると異なる特徴が一つにまとめられ、多すぎるとデータが細かくなりすぎて明確な傾向が見えません。一般的な経験則は Sturges の公式です。k = 1 + 3.322 × log₁₀(n) で、n はデータ点数です。たとえば 20 点なら約 5 階級、100 点なら約 7 階級が目安です。階級幅は width = (max − min) / k とし、すべてのデータがきれいに収まるよう、扱いやすい値に切り上げます。 度数分布から求める要約統計量は、個々の値ではなくグループ化されたデータに基づく近似です。グループ化された平均は Σ(階級値 × 度数) / n で求めます。グループ化された標準偏差は、グループ化平均の周りの散らばりを表します。グループ化された中央値は、n/2 番目の観測値を含む階級区間内で補間して推定します。階級幅が範囲に比べて小さい場合、これらの近似は元データから求めた厳密値にかなり近くなります。 度数分布は、数値データを扱うあらゆる分野で使われます。教育現場ではテスト結果を分析し、追加支援が必要な生徒を見つけます。企業では売上金額、製品レビュー評価、顧客待ち時間などを分析して、ピークやボトルネックを把握します。医療研究では血圧、コレステロール、BMI などの臨床指標を分布させ、集団の健康状態を理解します。品質管理では製造工程の測定値を調べ、不良やずれを検出します。どの場合も、度数分布表はより高度な分析の出発点になります。

度数分布 — 例

異なる階級構成と要約統計を示す、3 つの実用的なデータセットです。

データセット構造文脈
82,90,75,68,88,75,95,100,72,85,91,78,84,88,77,95,65,80,73,86 — 5 階級階級: [65,72), [72,79), [79,86) … ; 平均 ≈ 82.8520 人のクラスの生徒のテスト結果。階級幅 = 7。多くの得点は 72–93 の範囲に集中し、やや左裾がある。
150,220,180,190,250,160,200,210,170,240,195,175,215,185,230 — 6 階級階級: [150,170), [170,190), [190,210) … ; 平均 ≈ 202.7日次売上データ。階級幅 = 20。分布は、売上の多くが 170–230 ドルの範囲に集中していることを示します。
35,42,38,50,45,48,36,39,47,41,43,46,40,37,44,49,38,42,45,36 — 5 階級階級: [35,38), [38,41), [41,44) … ; 平均 ≈ 42.1植物学研究における植物の高さ(cm)。釣鐘型分布は、おおむね正規的な成長パターンを示しています。

度数分布計算機の使い方

  1. 「データセット」欄に数値データを入力します。カンマ、スペース、改行で区切れます。これらは混在していても構いません。
  2. データセットに合った階級数を選びます。小規模データ(n < 30)なら 5 階級、大きいものなら 7〜10 階級が出発点として適しています。Sturges の公式 k ≈ 1 + 3.322 × log₁₀(n) も使えます。
  3. [計算]をクリックします。計算機は最小値と最大値を求め、階級幅を (max − min) / classes として切り上げ、各データ点を適切な区間に割り当てます。
  4. 度数表を確認します。各行には階級区間、階級値、度数、相対度数(全体に対する割合)、累積度数(累計)が表示されます。
  5. 表の下にある要約統計量で、グループ化平均、中央値、標準偏差、階級幅を確認してください。読み込み例ボタンで、あらかじめ入力されたデータセットを試すこともできます。

度数分布計算機 — FAQ

度数分布表とは何ですか?
度数分布表は、生の数値データを階級区間(または bins)と呼ばれるグループにまとめ、各グループにいくつの値が入るかを数えます。無秩序な一覧を構造化された要約に変え、データがどこに集中しているか、どれだけ散らばっているか、全体の形がどう見えるかを示します。
階級数はどう選べばよいですか?
一般的には Sturges の公式 k = 1 + 3.322 × log₁₀(n) を使います。n は標本サイズです。これにより、20 点なら約 5 階級、100 点なら約 7 階級になります。まず 5 階級から始め、分布が明瞭になり、かつ雑然としすぎない範囲まで増やしていく方法もあります。多くの教科書では 5〜15 階級が推奨されています。
相対度数とは何で、なぜ便利なのですか?
相対度数は、ある階級に入る観測値の割合です。相対度数 = その階級の度数 / 全体 n。件数をパーセントに変換できるため、サイズの異なるデータセット同士を比較しやすくなります。たとえば、70〜80 の範囲に試験点の 35% が入ると分かれば、異なる規模の 2 つのクラスを比べる際に、単なる件数よりも有用です。
累積度数とは何ですか?
累積度数は、最初の階級から現在の階級までの度数の合計です。各階級の上限以下に何個のデータ点があるかを示します。たとえば、3 つ目の階級の終わりで累積度数が 15/20 なら、観測値の 75% は最初の 3 階級に入っています。累積度数は ogive(累積頻度曲線)の基礎です。
平均と標準偏差に「grouped」とあるのはなぜですか?
データを階級区間にまとめると、個々の正確な値は失われます。グループ化された平均と標準偏差は、各階級の階級値を代表値として計算するため、小さな近似が生じます。階級幅が範囲に比べて小さいときは非常に正確ですが、元データから計算した統計量とは少し異なる場合があります。
度数ヒストグラムと相対度数ヒストグラムの違いは何ですか?
度数ヒストグラムは y 軸に生の件数を描き、相対度数ヒストグラムは割合(またはパーセント)を描きます。相対度数ヒストグラムはサイズの異なるデータセットを直接比較でき、背後にある確率分布の経験的近似としても使えます。形は同じで、y 軸のスケールだけが変わります。