Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)

ノンパラメトリックな Wilcoxon 順位和検定(Mann-Whitney U)で2つの独立標本を比較します。正規性を仮定せず、U統計量・Zスコア・p値を取得できます。

2つの独立標本をカンマ区切りの数値で入力し、有意水準と片側・両側を選択してから、計算をクリックしてください。

Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)
ノンパラメトリックな Wilcoxon 順位和検定(Mann-Whitney U)で2つの独立標本を比較します。正規性を仮定せず、U統計量・Zスコア・p値を取得できます。

Wilcoxon順位和検定について

Wilcoxon順位和検定は Mann-Whitney U 検定とも呼ばれる、2つの独立標本が同じ分布をもつ母集団から来ているかを判断するためのノンパラメトリックな統計的仮説検定です。独立2標本 t 検定と異なり、データが正規分布に従うことを仮定しないため、順序尺度データ、歪んだ分布、あるいは正規性を確認できない小標本に有効です。 この検定は、1945年に Frank Wilcoxon が提案し、のちに Mann と Whitney が1947年に現在広く使われる形へ拡張しました。Mann-Whitney U 統計量は、一方の群の値が他方の群の値を上回る回数を数えます。ある標本の U がもう一方に比べて大きいほど、2つの母集団の中央値や中心傾向が異なる証拠になります。 計算では、まず2つの標本をまとめ、すべての観測値を小さい順に順位付けします。値が同じ場合は、その値が本来占める順位の平均を割り当てます。次に各群の順位和を別々に求め、その順位和から U 統計量を導きます。標本が大きい場合、U の分布は正規分布でよく近似できるため、Zスコアを用いて p値を求めます。 帰無仮説は、2つの母集団が同一であり、分布に系統的な差がないことを表します。対立仮説は、両側(任意の差)、右側(第1群の方が大きい)、左側(第1群の方が小さい)のいずれかです。適切な片側・両側は研究課題に基づいてデータ収集前に決め、第一種過誤の増大を避ける必要があります。 p値は選択した有意水準 α(通常は0.05)と照らして解釈します。p < α なら帰無仮説を棄却し、群間に統計的に有意な差があると結論します。p ≥ α なら、差があると結論するには証拠が不十分です。 この検定は、結果が正規分布に従わない可能性がある場合の治療群と対照群の比較など、医学で広く使われます。心理学では、人口属性の異なる群間でのリッカート尺度回答の比較に使えます。生態学では、2地点の測定値に有意差があるかを調べられます。教育では、異なる指導法で教えた学生の得点比較に使えます。 最良の結果を得るには、各標本内の観測が互いに独立であり、2つの標本同士も独立であることを確認してください。基礎分布の形が似ているとき、この検定は位置の違い(中央値のシフト)を検出するのに最も強力です。

実用例

よくあるシナリオを見て、Wilcoxon順位和検定の使い方を確認しましょう。

入力出力注記
S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailedU=4, Z≈−2.24, p≈0.025薬の回復時間 — 有意差あり。薬剤群の回復がより速い。
S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailedU=6, Z≈1.92, p≈0.027教授法の得点 — 新しい方法で有意に高い得点が得られた。
S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailedU=2, Z≈−2.88, p≈0.002肥料の収量 — B肥料の収量が有意に高い。

使い方

  1. 最初の欄に、標本1の数値をカンマまたはスペース区切りで入力します。
  2. 2つ目の欄に、独立した標本2の値を入力します。
  3. 対応するボタンをクリックして、有意水準 α(0.01、0.05、0.10)を選択します。
  4. 片側・両側を選びます。任意の差なら両側、標本1が大きいと予想するなら右側、標本1が小さいと予想するなら左側です。
  5. 計算をクリックすると、U統計量、Zスコア、p値、統計的判断が表示されます。

よくある質問

Wilcoxon順位和検定と Mann-Whitney U 検定の違いは何ですか?
同じ検定で、名称と定式化が異なるだけです。Wilcoxon は検定統計量を順位和として定義し、Mann と Whitney は一方の群に有利なペア比較の回数として U を定義しました。両者は線形に関係し、p値は同じになります。
t検定の代わりに Wilcoxon順位和検定を使うべきなのはいつですか?
データが順序尺度である場合、正規性の仮定が破れている場合(特に小標本)、または外れ値がある場合に使います。ほぼ正規分布の大標本では、t検定と Wilcoxon 検定の結果は似ますが、t検定の方が統計学的検出力はやや高くなります。
両側検定と片側検定の違いは何ですか?
両側検定は、方向を問わず群間に差があるかを調べます。右側検定は標本1が標本2より確率的に大きいかを調べ、左側検定はその逆を調べます。尾部の種類は、データ収集前に仮説に基づいて決めてください。
計算器は同順位の値をどう扱いますか?
結合したデータ内で同順位の値は、その順位の平均を与えます。たとえば2つの観測が3位と4位で同順位なら、どちらも 3.5 になります。この中間順位補正により、順位和の妥当性が保たれ、Z近似の精度も維持されます。
信頼できる Z スコア近似にはどのくらいの標本サイズが必要ですか?
一般的には n₁ と n₂ がともに少なくとも8〜10あれば、正規近似で十分と考えられます。非常に小さい標本(n < 8)では、U の厳密分布を使うべきです。この計算器は正規近似を使うため、極小標本では p値を慎重に解釈してください。
非数値データや順序データにも使えますか?
はい。Likert尺度の回答(1=まったくそう思わない、5=とてもそう思う)のように、観測に意味のある順位を付けられるなら適切です。必要なのは観測を並べられることだけで、正確な数値間隔は不要です。