Question 1

AUC란 무엇이며 왜 중요한가요?

Accepted Answer

AUC(ROC 곡선 아래 면적)는 분류기가 모든 임계값에서 양성 사례를 음성 사례보다 더 높게 순위화하는 능력을 측정합니다. 임계값에 독립적이고 클래스 불균형에도 강하므로, 의료, 머신러닝, 금융 분야의 이진 분류 모델에서 표준 벤치마크로 쓰입니다.

Question 2

AUC가 0.5라는 것은 무슨 뜻인가요?

Accepted Answer

AUC가 0.5라는 것은 분류기가 무작위 추측보다 나을 게 없다는 뜻입니다. 양성과 음성을 무작위로 순위화하고 있다는 의미입니다. 0.5보다 낮은 AUC는 분류기가 체계적으로 틀리고 있음을 뜻하며, 예측을 뒤집으면 우연 이상 성능을 얻을 수 있습니다.

Question 3

최적 임계값은 어떻게 선택하나요?

Accepted Answer

이 계산기는 Youden의 J 통계량(J = sensitivity + specificity − 1)을 사용해 최적 임계값을 선택합니다. 민감도와 특이도의 합을 최대화하여 균형 잡힌 운영점을 제공합니다. 비용 최소화나 F1 점수 최대화 같은 다른 기준은 사용 사례에 따라 다른 최적 임계값을 만들 수 있습니다.

Question 4

AUC는 다중 분류에도 사용할 수 있나요?

Accepted Answer

표준 AUC는 이진 분류용입니다. 다중 분류 문제에서는 각 클래스에 대해 one-vs-rest AUC를 계산하거나, macro-average 또는 weighted-average AUC를 보고할 수 있습니다. 이 계산기는 이진 분류(레이블 0과 1)만 지원합니다.

Question 5

민감도와 특이도의 차이는 무엇인가요?

Accepted Answer

민감도(재현율 또는 TPR)는 분류기가 진양성을 얼마나 잘 잡아내는지 측정합니다: TP / (TP + FN). 특이도는 오탐을 얼마나 잘 피하는지 측정합니다: TN / (TN + FP). 양성 사례를 놓치는 비용이 클 때(예: 질병 선별검사)는 높은 민감도가 중요하고, 위양성 비용이 클 때(예: 확진 검사)는 높은 특이도가 중요합니다.

Question 6

AUC가 항상 모델 평가에 가장 좋은 지표인가요?

Accepted Answer

AUC는 임계값 전반에서 모델을 비교하고 불균형 데이터셋을 다룰 때 훌륭하지만, 항상 최선은 아닙니다. 매우 불균형한 데이터에서는 PR-AUC(정밀도-재현율 곡선 아래 면적)가 더 유용한 경우가 많습니다. 특정 의사결정 임계값에서는 F1 점수, 정확도, Matthews 상관계수 같은 지표가 더 적절할 수 있습니다.

점수, 레이블 쌍	AUC	해석
0.9,1 / 0.8,1 / 0.3,0 / 0.2,0	AUC = 1.0	완벽한 분류기
0.9,1 / 0.8,1 / 0.75,1 / 0.6,0 / 0.55,1 / 0.45,0 / 0.4,0 / 0.35,0	AUC ≈ 0.9375	판별력이 매우 우수함
0.9,0 / 0.8,1 / 0.7,0 / 0.6,1 / 0.5,0 / 0.4,1	AUC ≈ 0.33	순위가 반대임 — 무작위보다 나쁨

ROC 곡선 및 AUC 계산기 - 이진 분류 모델 평가

ROC 곡선 및 AUC 계산기 소개

ROC 곡선 예시

이 계산기 사용법

자주 묻는 질문