Question 1

Quelle est la différence entre precision et recall ?

Accepted Answer

La precision répond à la question « parmi toutes les prédictions positives, combien étaient correctes ? », tandis que le recall répond à « parmi tous les positifs réels, combien le modèle a-t-il trouvés ? ». Une precision élevée signifie peu de faux positifs (le modèle est prudent lorsqu'il étiquette quelque chose comme positif). Un recall élevé signifie peu de faux négatifs (le modèle manque rarement un vrai positif). Il existe généralement un compromis entre les deux, contrôlé par le seuil de décision.

Question 2

Pourquoi l'accuracy n'est-elle pas toujours la meilleure métrique ?

Accepted Answer

L'accuracy peut être trompeuse sur des jeux de données déséquilibrés. Par exemple, si seulement 1 % des transactions sont frauduleuses, un modèle qui prédit toujours « non frauduleux » obtient 99 % d'accuracy mais ne détecte aucun cas de fraude. Dans ce type de situation, precision, recall, F1-score ou MCC donnent une vision bien plus utile des performances du modèle.

Question 3

Qu'est-ce que le coefficient de corrélation de Matthews (MCC) ?

Accepted Answer

Le MCC est une métrique unique et équilibrée qui prend en compte les quatre cellules de la matrice de confusion (TP, FP, TN, FN). Il varie de −1 à +1, où +1 correspond à une prédiction parfaite, 0 à une performance équivalente au hasard et −1 à un désaccord total. Le MCC est considéré comme l'une des métriques les plus informatives pour la classification binaire, surtout sur des jeux de données déséquilibrés, car il n'est pas gonflé par de forts déséquilibres de classes.

Question 4

Que mesure la specificity et quand est-elle importante ?

Accepted Answer

La specificity (Taux de vrais négatifs) = TN / (TN + FP) mesure la capacité du modèle à éviter les faux positifs parmi les négatifs réels. Elle est particulièrement importante en dépistage médical : un test à forte specificity minimise le nombre de personnes saines incorrectement signalées comme malades, réduisant les examens de suivi inutiles et l'anxiété des patients. La sensibilité (recall) et la specificity définissent ensemble la courbe ROC.

Question 5

Quel est le lien entre F1-score, precision et recall ?

Accepted Answer

Le F1-score est la moyenne harmonique de precision et recall : F1 = 2 × (P × R) / (P + R). L'utilisation de la moyenne harmonique garantit que le F1 est faible si precision ou recall est faible — vous ne pouvez pas obtenir un F1 élevé en sacrifiant l'un pour l'autre. Le F1 varie de 0 (pire) à 1 (meilleur) et c'est la métrique unique la plus courante lorsque vous devez équilibrer à la fois les faux positifs et les faux négatifs.

Question 6

Quelle est la différence entre sensibilité et specificity dans les tests médicaux ?

Accepted Answer

La sensibilité (recall) est la probabilité que le test identifie correctement un patient malade : TP / (TP + FN). Un test très sensible manque très peu de patients malades, ce qui le rend utile pour exclure une maladie. La specificity est la probabilité que le test identifie correctement une personne en bonne santé : TN / (TN + FP). Un test très spécifique produit peu de faux positifs, ce qui le rend utile pour confirmer une maladie. La plupart des tests diagnostiques impliquent un compromis entre les deux, représenté par la courbe ROC.

TP, FP, TN, FN	Métriques clés	Type de modèle
TP=92, FP=8, TN=88, FN=12	Accuracy=90%, F1=0.9020, MCC=0.801	Modèle bien équilibré et performant
TP=45, FP=5, TN=95, FN=25	Accuracy=82.35%, Precision=90%, Recall=64.29%	Haute precision, prédictions conservatrices
TP=85, FP=30, TN=70, FN=10	Accuracy=79.5%, Recall=89.5%, Specificity=70%	Recall élevé, modèle sensible
TP=48, FP=12, TN=188, FN=2	Accuracy=94%, Sensitivity=96%, Specificity=94%	Test diagnostique médical — haute sensibilité

Calculatrice de matrice de confusion - Métriques de classification

À propos de la calculatrice de matrice de confusion

Exemples

Comment utiliser la calculatrice de matrice de confusion

Foire aux questions