Question 1

適合率と再現率の違いは何ですか？

Accepted Answer

適合率は「正と予測したもののうち、どれだけ正しかったか？」に答え、再現率は「実際の正例のうち、どれだけ見つけられたか？」に答えます。適合率が高いと偽陽性が少なく（正と判断する際に慎重）、再現率が高いと偽陰性が少なくなります（本当の正例を見逃しにくい）。通常、この2つはトレードオフの関係にあり、判定閾値で調整されます。

Question 2

なぜ正確率だけでは最適な指標にならないのですか？

Accepted Answer

クラス不均衡なデータでは、正確率は誤解を招くことがあります。たとえば、取引の1%しか詐欺でない場合、常に「詐欺ではない」と予測するモデルでも正確率99%を達成できますが、詐欺は1件も検出できません。そのような場合は、適合率、再現率、F1スコア、MCC のほうがモデル性能をはるかに適切に示します。

Question 3

マシューズ相関係数 (MCC) とは何ですか？

Accepted Answer

MCC は、混同行列の4つのセル（TP、FP、TN、FN）すべてを考慮する、単一でバランスの取れた指標です。値は −1 から +1 の範囲で、+1 は完全予測、0 はランダム以下でも以上でもないこと、−1 は完全な不一致を意味します。MCC は二値分類、とくにクラス不均衡データで最も情報量の多い指標の1つと考えられています。大きなクラス偏りによって水増しされないためです。

Question 4

特異度は何を測り、いつ重要ですか？

Accepted Answer

特異度（真陰性率）= TN / (TN + FP) は、実際の負例の中で偽陽性をどれだけ避けられるかを示します。医療スクリーニングでは特に重要で、高特異度の検査は健康な人を病気と誤判定する件数を減らし、不要な再検査や患者の不安を抑えます。感度（再現率）と特異度を合わせて ROC 曲線が定義されます。

Question 5

F1スコアは適合率と再現率にどう関係しますか？

Accepted Answer

F1スコアは適合率と再現率の調和平均です。F1 = 2 × (P × R) / (P + R)。調和平均を使うため、適合率か再現率のどちらかが低いと F1 も低くなります。片方を犠牲にして高い F1 を得ることはできません。F1 の範囲は 0（最悪）から 1（最良）で、偽陽性と偽陰性の両方をバランスさせたいときによく使われる単一指標です。

Question 6

医療検査での感度と特異度の違いは何ですか？

Accepted Answer

感度（再現率）は、検査が病気の患者を正しく識別する確率です：TP / (TP + FN)。感度が高い検査は病気の見逃しが少ないため、除外診断に向いています。特異度は、検査が健康な人を正しく識別する確率です：TN / (TN + FP)。特異度が高い検査は偽陽性が少ないため、確定診断に向いています。多くの診断検査ではこの2つにトレードオフがあり、その関係は ROC 曲線で表されます。

TP, FP, TN, FN	主要指標	モデル種別
TP=92, FP=8, TN=88, FN=12	正確率=90%, F1=0.9020, MCC=0.801	バランスが良く高性能なモデル
TP=45, FP=5, TN=95, FN=25	正確率=82.35%, 適合率=90%, 再現率=64.29%	高適合率の保守的な予測
TP=85, FP=30, TN=70, FN=10	正確率=79.5%, 再現率=89.5%, 特異度=70%	高再現率の高感度モデル
TP=48, FP=12, TN=188, FN=2	正確率=94%, 感度=96%, 特異度=94%	医療診断テスト — 高感度

混同行列計算ツール - 分類指標

混同行列計算ツールについて

例

混同行列計算ツールの使い方

よくある質問