Q: 有意結果は実際には何を意味しますか？

有意結果（p ≤ α）は、帰無仮説が真であるなら、観測された平均差が偶然に生じた可能性は低いことを意味します。しかし、帰無仮説が偽であることの証明でもなければ、効果が大きい、あるいは臨床的に重要であることの保証でもありません。d̄、信頼区間、そして効果量（たとえば Cohen's d = d̄ / s_d）を必ず報告し、読者が実用上の意味を判断できるようにしてください。

Question 1

独立サンプル t 検定ではなく、対応のある t 検定を使うのはいつですか？

Accepted Answer

一方のグループの各観測値が、他方のグループのちょうど1つの観測値と自然に対応している、または結び付いている場合に使います。例えば同じ人の治療前後の測定、あるいは2人の兄弟姉妹を別々の食事法に割り当てた場合です。2群が独立（無関係な別個体で対応づけがない）なら、独立サンプル t 検定を使います。

Question 2

仮定平均との差 μ₀ とは何ですか？

Accepted Answer

μ₀ は、帰無仮説の下で真の平均差が等しいと仮定する値です。多くの用途では、介入に効果があるかどうかを調べるため μ₀ = 0 を使います。たとえば薬が血圧を少なくとも 10 mmHg 下げるかを検定する場合は、μ₀ = 10 とします。

Question 3

差が正規分布していない場合はどうすればよいですか？

Accepted Answer

対応のある t 検定は、差がほぼ正規分布していることを前提とします。n ≥ 30 ペアなら、中心極限定理によりこの前提はそれほど重要ではありません。小標本で差が明らかに正規的でない場合（ヒストグラムを確認してください）、Wilcoxon の符号順位検定は正規性を仮定しない堅牢な非パラメトリック代替手法です。

Question 4

信頼区間はどう解釈しますか？

Accepted Answer

95%信頼区間は、真の平均差として妥当な値の範囲を示します。区間に 0 が含まれなければ、結果は α = 0.05 で有意です。区間は効果の大きさと方向を示すため、p 値単独よりも有益です。たとえば (2.3, 9.8) という区間は、結果が有意であり、効果が小さいものから中程度に大きいものまであり得ることを示します。

Question 5

片側の対応のある t 検定はできますか？

Accepted Answer

はい。グループ1 > グループ2（正の平均差）と予測するなら「右側検定」、グループ1 < グループ2（負の平均差）と予測するなら「左側検定」を選びます。片側検定は検出力が高いですが、効果の方向をデータ収集前に指定していた場合にのみ有効です。両側検定の結果が境界線上だったからという理由だけで片側検定にするのは p-hacking です。

Question 6

有意結果は実際には何を意味しますか？

Accepted Answer

有意結果（p ≤ α）は、帰無仮説が真であるなら、観測された平均差が偶然に生じた可能性は低いことを意味します。しかし、帰無仮説が偽であることの証明でもなければ、効果が大きい、あるいは臨床的に重要であることの保証でもありません。d̄、信頼区間、そして効果量（たとえば Cohen's d = d̄ / s_d）を必ず報告し、読者が実用上の意味を判断できるようにしてください。

研究デザイン	t 値 / p 値	結論
血圧（前）: 140,135,150,155,130,142,138,147,152,133 / （後）: 132,130,145,148,125,135,130,140,145,128（両側、α=0.05、n=10）	t ≈ 16.00, df = 9, p < 0.001	非常に有意です。薬により 10 人の収縮期血圧が平均 6.4 mmHg 低下しました。
テスト得点（前）: 75,80,82,70,88,65,90,78 / （後）: 85,85,88,78,92,75,95,85（両側、α=0.05、n=8）	t ≈ −8.47, df = 7, p < 0.001	有意な改善です。個別指導プログラム後、学生の得点は平均 6.9 点上がりました。
週売上（前）: 500,550,480,600,520,530 / （後）: 540,580,500,650,550,560（両側、α=0.05、n=6）	t ≈ −7.91, df = 5, p < 0.001	広告キャンペーンにより、店舗あたりの週売上は平均 33.3 単位増加しました。

対応のある t 検定計算機 - 前後データ

対応のある t 検定計算機について

計算例

対応のある t 検定計算機の使い方

よくある質問