Question 1

Qual é a diferença entre precision e recall?

Accepted Answer

Precision responde 'de todas as previsões positivas, quantas estavam corretas?' enquanto recall responde 'de todos os positivos reais, quantos o modelo encontrou?'. Precision alta significa poucos falsos positivos (o modelo é cuidadoso ao rotular algo como positivo). Recall alto significa poucos falsos negativos (o modelo raramente deixa passar um verdadeiro positivo). Normalmente há um trade-off entre eles, controlado pelo limiar de decisão.

Question 2

Por que accuracy nem sempre é a melhor métrica?

Accepted Answer

Accuracy pode ser enganosa em conjuntos desbalanceados. Por exemplo, se apenas 1% das transações forem fraudulentas, um modelo que sempre prevê 'não fraude' alcança 99% de accuracy, mas não detecta nenhum caso de fraude. Nesses cenários, precision, recall, F1-score ou MCC fornecem uma visão muito mais informativa do desempenho do modelo.

Question 3

O que é o Coeficiente de Correlação de Matthews (MCC)?

Accepted Answer

MCC é uma métrica única e equilibrada que considera as quatro células da matriz de confusão (TP, FP, TN, FN). Ela varia de −1 a +1, onde +1 é previsão perfeita, 0 é tão bom quanto aleatório e −1 é discordância total. O MCC é considerado uma das métricas mais informativas para classificação binária, especialmente em conjuntos desbalanceados, porque não é inflado por grandes desequilíbrios de classe.

Question 4

O que a specificity mede e quando ela é importante?

Accepted Answer

Specificity (Taxa de verdadeiros negativos) = TN / (TN + FP) mede o quão bem o modelo evita falsos positivos entre os negativos reais. Ela é especialmente importante em triagem médica: um teste com alta specificity minimiza o número de pessoas saudáveis marcadas incorretamente como doentes, reduzindo exames de acompanhamento desnecessários e a ansiedade do paciente. Sensibilidade (recall) e specificity juntas definem a curva ROC.

Question 5

Como o F1-score se relaciona com precision e recall?

Accepted Answer

O F1-score é a média harmônica de precision e recall: F1 = 2 × (P × R) / (P + R). Usar a média harmônica garante que o F1 seja baixo se precision ou recall for baixo — você não pode obter um F1 alto sacrificando um pelo outro. O F1 varia de 0 (pior) a 1 (melhor) e é a métrica única mais comum quando você precisa equilibrar falsos positivos e falsos negativos.

Question 6

Qual é a diferença entre sensibilidade e specificity em testes médicos?

Accepted Answer

Sensibilidade (recall) é a probabilidade de o teste identificar corretamente um paciente doente: TP / (TP + FN). Um teste muito sensível perde muito poucos pacientes doentes, sendo bom para descartar doença. Specificity é a probabilidade de o teste identificar corretamente uma pessoa saudável: TN / (TN + FP). Um teste muito específico produz poucos falsos positivos, sendo bom para confirmar doença. A maioria dos testes diagnósticos envolve um trade-off entre os dois, representado pela curva ROC.

TP, FP, TN, FN	Métricas principais	Tipo de modelo
TP=92, FP=8, TN=88, FN=12	Accuracy=90%, F1=0.9020, MCC=0.801	Modelo bem equilibrado e de alto desempenho
TP=45, FP=5, TN=95, FN=25	Accuracy=82.35%, Precision=90%, Recall=64.29%	Alta precision, previsões conservadoras
TP=85, FP=30, TN=70, FN=10	Accuracy=79.5%, Recall=89.5%, Specificity=70%	Recall alto, modelo sensível
TP=48, FP=12, TN=188, FN=2	Accuracy=94%, Sensitivity=96%, Specificity=94%	Teste diagnóstico médico — alta sensibilidade

Calculadora de matriz de confusão - Métricas de classificação

Sobre a calculadora de matriz de confusão

Exemplos

Como usar a calculadora de matriz de confusão

Perguntas frequentes