ウィルコクソン順位和検定計算機(Mann-Whitney U)
ノンパラメトリックなウィルコクソン順位和検定(Mann-Whitney U)で2つの独立した標本を比較します。正規性を仮定せずにU統計量、Zスコア、p値を求められます。
2つの独立した標本をカンマ区切りで入力し、有意水準と片側・両側の種類を選んでから「計算」をクリックしてください。
ウィルコクソン順位和検定計算機(Mann-Whitney U)
ノンパラメトリックなウィルコクソン順位和検定(Mann-Whitney U)で2つの独立した標本を比較します。正規性を仮定せずにU統計量、Zスコア、p値を求められます。
ウィルコクソン順位和検定について
ウィルコクソン順位和検定は、Mann-Whitney U検定とも呼ばれるノンパラメトリックな統計的仮説検定で、2つの独立した標本が同じ分布を持つ母集団から得られたかどうかを判定するために用いられます。独立2標本 t 検定と異なり、データが正規分布に従うことを仮定しないため、順序尺度データ、歪んだ分布、あるいは正規性を確認できない小標本に有効です。
この検定は1945年にFrank Wilcoxonによって提案され、1947年にMannとWhitneyによって現在よく使われる形に拡張されました。Mann-Whitney U統計量は、あるグループの値が別のグループの値を上回る回数を数えます。片方の標本に対してUが大きいほど、2つの母集団の中央値や中心傾向が異なる証拠になります。
計算手順では、まず両方の標本をまとめ、すべての観測値を小さい順に並べて順位を付けます。同順位の値には、本来占める順位の平均順位を与えます。次に各グループの順位和を別々に求め、その順位和からU統計量を導きます。大きな標本ではUの分布は正規分布でよく近似できるため、Zスコアを使ってp値を求めます。
帰無仮説は、2つの母集団が同一であり、分布に体系的な差がないことを表します。対立仮説は、両側(いかなる差もある)、右側(標本1のほうが大きい傾向がある)、左側(標本1のほうが小さい傾向がある)のいずれかです。尾の種類は研究課題に基づいてデータ収集前に決めるべきであり、第1種の誤りを増やさないために重要です。
p値は、選択した有意水準α(一般に0.05)と照らして解釈します。p < α なら帰無仮説を棄却し、群間に統計的に有意な差があると結論づけます。p ≥ α なら、差があると結論づけるには証拠が不十分です。
この検定は、結果が正規分布しない可能性がある治療群と対照群の患者アウトカム比較など、医学で広く使われます。心理学では、異なる属性群間のLikert尺度アンケート回答の比較に使えます。生態学では、2地点の測定値に有意差があるかを検定できます。教育分野では、異なる教授法で教えられた学生のテスト成績を比較できます。
最良の結果を得るには、各標本内の観測値が互いに独立であり、2つの標本同士も独立であることを確認してください。基礎となる分布の形が似ている場合、この検定は位置の差(中央値のシフト)を検出するのに最も有効です。
実用例
よくあるケースを見て、ウィルコクソン順位和検定の使い方を確認しましょう。
| 入力 | 出力 | 注記 |
|---|---|---|
| S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailed | U=4, Z≈−2.24, p≈0.025 | 薬の回復時間 — 有意差あり。薬物群の回復がより速い。 |
| S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailed | U=6, Z≈1.92, p≈0.027 | 教授法の得点 — 新しい方法のほうが有意に高得点。 |
| S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailed | U=2, Z≈−2.88, p≈0.002 | 肥料による作物収量 — 肥料Bの収量が有意に高い。 |
使い方
- 最初の欄に標本1の数値をカンマまたはスペースで区切って入力します。
- 2つ目の欄に独立した標本2の値を入力します。
- 対応するボタンをクリックして有意水準α(0.01、0.05、0.10)を選択します。
- 尾の種類を選びます。両側はあらゆる差、右側は標本1が大きいと想定する場合、左側は標本1が小さいと想定する場合です。
- 「計算」をクリックすると、U統計量、Zスコア、p値、統計的判断が表示されます。
FAQ
ウィルコクソン順位和検定とMann-Whitney U検定の違いは何ですか?
実質的には同じ検定で、名前と定式化が異なるだけです。Wilcoxonは検定統計量を順位和として定義し、MannとWhitneyはUを一方の群に有利なペア比較の回数として定義しました。2つの統計量は線形に関連し、同じp値を与えます。
t検定ではなくウィルコクソン順位和検定を使うべきなのはいつですか?
データが順序尺度である場合、正規性の仮定が成り立たない場合(特に小標本)、または外れ値がある場合に使います。ほぼ正規分布の大標本では、t検定とウィルコクソン検定は似た結果になりますが、t検定のほうがわずかに検出力が高いです。
両側検定と片側検定の違いは何ですか?
両側検定は、方向に関係なく群間の差があるかを調べます。右側検定は標本1が標本2より確率的に大きいかを調べ、左側検定はその逆を調べます。尾の種類は、必ずデータ収集前に仮説に基づいて決めてください。
計算機は同順位の値をどう扱いますか?
結合データセット全体で同順位になった値には、本来占める順位の平均順位が与えられます。たとえば、2つの観測値が3位と4位で同順位なら、どちらも3.5位になります。この中間順位補正により順位和が有効に保たれ、Z近似の精度も維持されます。
信頼できるZスコア近似にはどのくらいの標本サイズが必要ですか?
一般に、n₁とn₂の両方が少なくとも8〜10以上あれば、正規近似は十分と考えられます。非常に小さい標本(n < 8)では、Uの正確分布を使うべきです。この計算機は正規近似を使用するため、極小標本ではp値の解釈に注意してください。
この検定は非数値データや順序データにも使えますか?
はい。観測値に意味のある順位を付けられるなら、たとえばLikert尺度の回答(1=まったくそう思わない、5=強くそう思う)のようなデータでも、ウィルコクソン順位和検定は適しています。必要なのは観測値を順序付けできることだけで、正確な数値差は不要です。