Calculateur IQR - écart interquartile et valeurs aberrantes

Calculez l'écart interquartile (IQR), les quartiles Q1 et Q3, la médiane, et identifiez les valeurs aberrantes avec la règle 1.5×IQR à partir de tout jeu de données séparé par des virgules.

Saisissez vos données sous forme de nombres séparés par des virgules, puis cliquez sur Calculer pour obtenir le résumé à cinq nombres, l'IQR, les valeurs des seuils et les valeurs aberrantes.

Calculateur IQR - écart interquartile et valeurs aberrantes
Calculez l'écart interquartile (IQR), les quartiles Q1 et Q3, la médiane, et identifiez les valeurs aberrantes avec la règle 1.5×IQR à partir de tout jeu de données séparé par des virgules.

Saisissez des nombres séparés par des virgules ou des espaces, p. ex. 2, 4, 4, 5, 6, 7, 8, 9

À propos du calculateur IQR

L'écart interquartile (IQR) est l'étendue des 50% centraux d'un jeu de données : la distance entre le 25e percentile (Q1) et le 75e percentile (Q3). C'est l'une des mesures de dispersion statistique les plus robustes et les plus utilisées, car contrairement à l'étendue totale ou à l'écart type, elle n'est pas affectée par les valeurs extrêmes ni par les valeurs aberrantes. Que vous analysiez des notes d'examen, des mesures de tension artérielle, des prix immobiliers, des tolérances de fabrication ou tout autre jeu de données réel, l'IQR donne une image fiable de la dispersion centrale. Pour calculer l'IQR, le calculateur trie d'abord les données de la plus petite à la plus grande, puis localise Q1 et Q3 à l'aide d'une interpolation linéaire sur les statistiques d'ordre. Q1 est la valeur au 25e percentile, le point en dessous duquel se trouvent 25% des données. Q3 est la valeur au 75e percentile, le point en dessous duquel se trouvent 75% des données. L'IQR est simplement Q3 − Q1. La médiane (Q2), le minimum et le maximum sont également fournis afin de présenter le résumé complet à cinq nombres, fondement d'un diagramme en boîte à moustaches. La règle 1.5×IQR, introduite par John Tukey, est la méthode standard pour identifier les valeurs aberrantes potentielles. Tout point de données situé sous le seuil inférieur (Q1 − 1.5×IQR) ou au-dessus du seuil supérieur (Q3 + 1.5×IQR) est considéré comme une valeur aberrante suspecte. Ces seuils définissent les moustaches dans une boîte à moustaches de Tukey. Un point situé à plus de 3×IQR du quartile le plus proche (le seuil interne prolongé jusqu'à un seuil externe) est considéré comme une valeur aberrante extrême. Le calculateur signale toutes les valeurs situées hors des seuils 1.5×IQR. Il est important de noter que la règle 1.5×IQR identifie des valeurs aberrantes statistiques — des valeurs anormalement éloignées du bloc central des données — mais pas nécessairement des erreurs de données. Un point signalé comme aberrant peut être une erreur de mesure, une erreur de saisie, un signal de fraude ou simplement une observation réellement rare mais légitime. Les connaissances métier restent indispensables pour décider quoi faire des points signalés. L'IQR est la mesure de dispersion privilégiée lorsque les données sont asymétriques ou lorsque des valeurs aberrantes sont attendues, comme dans les distributions de revenus, les temps de réaction ou les prix immobiliers sur des marchés mixtes. Pour des données symétriques, normalement distribuées et sans valeurs aberrantes, l'écart type est légèrement plus efficace. Mais lorsque la robustesse compte — en analyse exploratoire des données, en statistiques non paramétriques ou dès que vous ne pouvez pas supposer la normalité — l'IQR est l'outil de référence pour caractériser la dispersion du centre de vos données.

Exemples d'IQR

Quatre jeux de données montrant comment l'IQR et la détection des valeurs aberrantes fonctionnent en pratique.

Jeu de donnéesIQRNotes
2, 4, 4, 5, 6, 7, 8, 9IQR = 3.25 (Q1=4, Q3=7.25)Nombre pair de valeurs. Q1=4, médiane=5.5, Q3=7.25. Aucune valeur aberrante détectée.
10, 20, 30, 40, 50, 60, 70IQR = 30 (Q1=25, Q3=55)Effectif impair : Q1=25, médiane=40, Q3=55, IQR=30. Seuil inférieur=−20, seuil supérieur=100. Aucune valeur aberrante.
6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49, 78, 108IQR = 11 (Q1=36, Q3=47)Seuil inférieur=19.5, seuil supérieur=63.5. Les valeurs 6, 7, 15, 78 et 108 sont signalées comme aberrantes.
88, 92, 80, 78, 95, 84, 76, 90, 81, 85, 93IQR = 10.5 (Q1=80.5, Q3=91)Notes de test allant de 76 à 95. Aucune valeur aberrante : les performances de la classe sont bien regroupées.

Comment utiliser le calculateur IQR

  1. Saisissez votre jeu de données dans le champ d'entrée sous forme de nombres séparés par des virgules. Vous pouvez aussi utiliser des espaces comme séparateurs. L'ordre des valeurs n'a pas d'importance : le calculateur les trie automatiquement.
  2. Cliquez sur Calculer l'IQR. L'outil affiche n (effectif), le minimum, le maximum, Q1, la médiane, Q3, l'IQR, les seuils inférieur et supérieur, ainsi que les valeurs aberrantes.
  3. Examinez l'IQR pour comprendre à quel point les 50% centraux de vos données sont dispersés. Un IQR plus grand signifie une plus forte variabilité dans la partie centrale des données.
  4. Vérifiez les valeurs des seuils. Tout point inférieur à Q1 − 1.5×IQR ou supérieur à Q3 + 1.5×IQR est listé comme valeur aberrante potentielle. Examinez chaque point signalé pour déterminer s'il s'agit d'une erreur de données ou d'une vraie valeur extrême.
  5. Utilisez les boutons d'exemple pour charger des jeux de données prédéfinis et voir comment l'IQR et la détection des valeurs aberrantes réagissent à différentes distributions.

FAQ IQR

Qu'est-ce que l'écart interquartile (IQR) ?
L'écart interquartile est la différence entre le troisième quartile (Q3, 75e percentile) et le premier quartile (Q1, 25e percentile) : IQR = Q3 − Q1. Il représente la dispersion des 50% centraux des données. Comme il ignore les 25% supérieurs et les 25% inférieurs des valeurs, l'IQR n'est pas affecté par les valeurs extrêmes, ce qui en fait une mesure de dispersion plus robuste que l'étendue totale ou l'écart type lorsque les données sont asymétriques ou contiennent des anomalies.
Comment Q1 et Q3 sont-ils calculés ?
Le calculateur utilise une interpolation linéaire sur les données triées. Pour Q1, la position est 0.25 × (n−1) dans un tableau trié indexé à partir de zéro. Si cette position n'est pas un entier, la valeur est interpolée entre les deux points de données adjacents. La même méthode est utilisée pour Q3 à la position 0.75 × (n−1). C'est la même méthode que celle utilisée par des logiciels statistiques comme R (type 7) et la fonction QUARTILE.INC d'Excel.
Comment la règle 1.5×IQR identifie-t-elle les valeurs aberrantes ?
La règle 1.5×IQR de John Tukey définit le seuil inférieur = Q1 − 1.5×IQR et le seuil supérieur = Q3 + 1.5×IQR. Tout point de données situé hors de ces seuils est une valeur aberrante potentielle. Le multiplicateur 1.5 a été choisi parce que, pour une distribution parfaitement normale, seulement environ 0.7% des valeurs tombent hors de ces seuils, ce qui les rend très peu susceptibles d'apparaître par hasard. Une règle plus stricte utilise un multiplicateur de 3.0 et ne signale que les points les plus extrêmes comme valeurs très éloignées.
L'IQR est-il meilleur que l'écart type pour mesurer la dispersion ?
Chaque mesure convient à des situations différentes. L'écart type utilise toutes les valeurs et est optimal pour des données symétriques, normalement distribuées et sans valeurs aberrantes. L'IQR n'utilise que les 50% centraux des valeurs et résiste beaucoup mieux à l'asymétrie et aux valeurs aberrantes. Si vos données sont approximativement normales, l'écart type fournit plus d'informations. Si elles sont asymétriques (revenus, prix immobiliers, durées de survie) ou contiennent des valeurs aberrantes, l'IQR est la meilleure mesure de la dispersion typique.
Puis-je utiliser l'IQR pour un jeu de données de seulement deux ou trois valeurs ?
Techniquement oui, mais le résultat est d'une utilité limitée. Avec de très petits échantillons (n < 4 ou 5), les estimations des quartiles sont très instables et l'IQR ne représente pas de manière fiable la dispersion de la population. La règle de détection 1.5×IQR fonctionne aussi mal avec de minuscules échantillons : elle peut ne signaler aucune valeur aberrante même si les données contiennent des erreurs, ou produire des seuils qui excluent des valeurs légitimes. Une analyse IQR pertinente nécessite généralement au moins 5 à 10 observations.