Question 1

AUCとは何ですか？なぜ重要なのですか？

Accepted Answer

AUC（ROC曲線下面積）は、分類器がすべての閾値において正例を負例より高く順位付けできる能力を測ります。閾値に依存せず、クラス不均衡にも強いため、医療、機械学習、金融における二値分類モデルの標準指標です。

Question 2

AUCが0.5というのはどういう意味ですか？

Accepted Answer

AUCが0.5というのは、分類器がランダム推測と同程度であることを意味します。正例と負例をランダムに順位付けしているだけです。0.5未満のAUCは、分類器が体系的に誤っていることを示し、予測を反転すると偶然以上の性能が得られる可能性があります。

Question 3

最適閾値はどのように選ばれますか？

Accepted Answer

この計算機では Youden の J 統計量（J = sensitivity + specificity − 1）を使って最適閾値を選びます。感度と特異度の合計を最大化し、バランスのよい動作点を提供します。コスト最小化やF1スコア最大化などの別基準では、用途によって異なる最適閾値になることがあります。

Question 4

AUCは多クラス分類にも使えますか？

Accepted Answer

標準のAUCは二値分類向けです。多クラス問題では、各クラスごとに one-vs-rest AUC を計算するか、マクロ平均AUCや重み付き平均AUCを報告します。この計算機は二値分類（ラベル0と1）のみをサポートします。

Question 5

感度と特異度の違いは何ですか？

Accepted Answer

感度（再現率またはTPR）は、真陽性をどれだけうまく検出できるかを示します：TP / (TP + FN)。特異度は、誤報をどれだけ避けられるかを示します：TN / (TN + FP)。陽性を見逃す代償が大きい場合（例：疾病スクリーニング）は高い感度が重要で、偽陽性の代償が大きい場合（例：確認検査）は高い特異度が重要です。

Question 6

AUCは常にモデル評価の最適な指標ですか？

Accepted Answer

AUCは閾値をまたいでモデルを比較するのに優れており、不均衡データにも強いですが、常に最良とは限りません。極端に不均衡なデータでは、PR-AUC（適合率-再現率曲線下面積）のほうが有益なことが多いです。特定の意思決定閾値では、F1スコア、accuracy、Matthews 相関係数のほうが適切な場合があります。

スコア、ラベルの組	AUC	解釈
0.9,1 / 0.8,1 / 0.3,0 / 0.2,0	AUC = 1.0	完全な分類器
0.9,1 / 0.8,1 / 0.75,1 / 0.6,0 / 0.55,1 / 0.45,0 / 0.4,0 / 0.35,0	AUC ≈ 0.9375	判別能力が非常に高い
0.9,0 / 0.8,1 / 0.7,0 / 0.6,1 / 0.5,0 / 0.4,1	AUC ≈ 0.33	順位が逆転している — ランダムより悪い

ROC曲線とAUC計算機 - 二値分類モデル評価

ROC曲線とAUC計算機について

ROC曲線の例

この計算機の使い方

よくある質問