Question 1

AUC는 무엇이며 왜 중요한가요?

Accepted Answer

AUC(ROC 곡선 아래 면적)는 분류기가 모든 임계값에서 양성 사례를 음성 사례보다 더 높게 순위화하는 능력을 측정합니다. 임계값에 독립적이고 클래스 불균형에 강하므로, 의료, 머신러닝, 금융 분야의 이진 분류 모델에서 표준 기준입니다.

Question 2

AUC가 0.5라는 것은 무슨 뜻인가요?

Accepted Answer

AUC가 0.5라는 것은 분류기가 무작위 추측보다 낫지 않다는 뜻으로, 양성과 음성 사례를 무작위로 순위화하고 있음을 의미합니다. 0.5보다 낮은 AUC는 분류기가 체계적으로 잘못되었으며, 예측을 뒤집으면 우연 이상의 성능을 얻을 수 있음을 나타냅니다.

Question 3

최적 임계값은 어떻게 선택되나요?

Accepted Answer

이 계산기는 Youden의 J 통계량(J = 민감도 + 특이도 − 1)을 사용해 최적 임계값을 선택합니다. 민감도와 특이도의 합을 최대화해 균형 잡힌 운영점을 제공합니다. 비용 최소화나 F1-score 최대화 같은 대안 기준은 응용에 따라 다른 최적 임계값을 낼 수 있습니다.

Question 4

AUC는 다중 분류에도 사용할 수 있나요?

Accepted Answer

표준 AUC는 이진 분류용으로 정의됩니다. 다중 분류 문제에서는 각 클래스에 대해 one-vs-rest AUC를 계산하거나, macro-average 또는 weighted-average AUC를 보고할 수 있습니다. 이 계산기는 이진 분류(레이블 0과 1)만 지원합니다.

Question 5

민감도와 특이도의 차이는 무엇인가요?

Accepted Answer

민감도(재현율 또는 TPR)는 분류기가 실제 양성을 얼마나 잘 감지하는지 측정합니다: TP / (TP + FN). 특이도는 오경보를 얼마나 잘 피하는지 측정합니다: TN / (TN + FP). 양성 사례를 놓치는 비용이 클 때(예: 질병 선별) 높은 민감도가 중요하고, 위양성이 비싼 경우(예: 확진 검사)에는 높은 특이도가 중요합니다.

Question 6

AUC가 항상 모델 평가에 가장 좋은 지표인가요?

Accepted Answer

AUC는 임계값 전반에서 모델을 비교하고 불균형 데이터셋을 다루는 데 매우 좋지만, 항상 최선은 아닙니다. 매우 불균형한 데이터에서는 Precision-Recall AUC(PR-AUC)가 더 유익한 경우가 많습니다. 특정 결정 임계값에서는 F1-score, 정확도, Matthews 상관계수가 더 관련 있을 수 있습니다.

점수, 레이블 쌍	AUC	해석
0.9,1 / 0.8,1 / 0.3,0 / 0.2,0	AUC = 1.0	완벽한 분류기
0.9,1 / 0.8,1 / 0.75,1 / 0.6,0 / 0.55,1 / 0.45,0 / 0.4,0 / 0.35,0	AUC ≈ 0.9375	판별력이 매우 우수함
0.9,0 / 0.8,1 / 0.7,0 / 0.6,1 / 0.5,0 / 0.4,1	AUC ≈ 0.33	역순 정렬 — 무작위보다 나쁨

ROC 곡선 및 AUC 계산기 - 이진 분류기 평가

ROC 곡선 및 AUC 계산기에 대해

ROC 곡선 예시

이 계산기 사용 방법

자주 묻는 질문