Calculateur de dispersion - Variance, écart-type et IQR
Calculez l’ensemble des mesures de dispersion statistique — étendue, variance, écart-type, IQR, coefficient de variation et MAD — à partir de n’importe quel jeu de données.
Saisissez vos nombres sous forme de liste séparée par des virgules et cliquez sur Calculer pour voir instantanément toutes les statistiques de dispersion et de tendance centrale.
Calculateur de dispersion - Variance, écart-type et IQR
Calculez l’ensemble des mesures de dispersion statistique — étendue, variance, écart-type, IQR, coefficient de variation et MAD — à partir de n’importe quel jeu de données.
À propos du calculateur de dispersion
La dispersion statistique décrit à quel point les valeurs d’un jeu de données sont étalées. Alors que les mesures de tendance centrale — moyenne, médiane et mode — indiquent où se situe le centre d’une distribution, les mesures de dispersion montrent à quelle distance les valeurs individuelles s’éloignent de ce centre. Deux jeux de données peuvent partager la même moyenne tout en ayant des distributions très différentes ; ce sont les mesures de dispersion qui révèlent cette différence.
L’étendue est la mesure de dispersion la plus simple : la différence entre la plus grande et la plus petite valeur. Elle est facile à calculer et à interpréter, mais elle est sensible aux valeurs aberrantes car elle dépend entièrement des deux extrêmes et ignore tout le reste.
La variance mesure la moyenne des écarts au carré par rapport à la moyenne. La variance de l’échantillon divise la somme des écarts au carré par (n−1) — avec la correction de Bessel pour fournir une estimation non biaisée de la variance de la population lorsqu’on travaille sur un échantillon. La variance de la population divise par n et n’est appropriée que lorsque votre jeu de données correspond à l’ensemble de la population d’intérêt. L’écart-type est la racine carrée de la variance, exprimée dans les mêmes unités que les données d’origine.
L’écart interquartile (IQR) mesure l’étendue des 50 % centraux des données. Il se calcule comme Q3 − Q1, où Q1 est le 25e percentile et Q3 le 75e percentile. Comme il ignore les 25 % inférieurs et supérieurs, l’IQR résiste mieux aux valeurs aberrantes et constitue la mesure de dispersion privilégiée pour les distributions asymétriques.
Le coefficient de variation (CV) exprime l’écart-type de l’échantillon en pourcentage de la moyenne, ce qui en fait une mesure sans dimension permettant de comparer la variabilité relative de jeux de données mesurés dans des unités ou à des échelles différentes. Un CV de 10 % signifie que l’écart-type représente 10 % de la moyenne — un repère utile pour comparer la précision des mesures entre expériences.
L’écart absolu médian (MAD) est la médiane des écarts absolus à la médiane. Il est encore plus robuste aux valeurs aberrantes que l’IQR et est utilisé en statistique robuste et en détection d’anomalies. Comme l’IQR, la MAD résiste aux valeurs extrêmes et fournit une mesure fiable de la dispersion pour les jeux de données à queues lourdes ou asymétriques.
Exemples du calculateur de dispersion
Trois jeux de données réels illustrant différents profils de dispersion.
| Jeu de données | Indicateurs clés | Interprétation |
|---|---|---|
| 85, 92, 78, 88, 76, 95, 89, 72 | Moyenne=84.375, ET≈8.19, IQR=12.25 | Notes d’un contrôle en classe. CV≈9.71 % indique une dispersion relative modérée. Un IQR de 12.25 montre que les 50 % centraux des élèves ont obtenu des scores dans une plage de 12 points. |
| 1.2, -0.5, 2.1, 0.8, -1.9, 1.5, 2.5, -0.2, 0.3, 1.7, -1.1, 2.3 | Moyenne=0.725, ET≈1.40, IQR=2.075 | Rendements mensuels d’actions (%). Un CV élevé (>100 %) reflète une volatilité importante par rapport à la faible moyenne positive. |
| 502, 499, 505, 498, 501, 503, 497, 500 | Moyenne=500.625, ET≈2.67, CV≈0.53% | Poids des produits (g) dans un lot de contrôle qualité. Un CV très faible confirme une fabrication très régulière autour de l’objectif de 500 g. |
Comment utiliser le calculateur de dispersion
- Saisissez ou collez vos valeurs dans la zone de texte, séparées par des virgules, des espaces ou des retours à la ligne.
- Cliquez sur Calculer. Le calculateur analyse les nombres et ignore tout jeton non numérique.
- Consultez les mesures de tendance centrale (nombre, moyenne, médiane) pour comprendre où se situe le centre de vos données.
- Vérifiez les métriques de dispersion : l’étendue pour la portée globale, l’écart-type pour l’écart moyen par rapport à la moyenne et l’IQR pour l’étalement des 50 % centraux.
- Utilisez le coefficient de variation pour comparer la variabilité relative entre différents jeux de données, et la MAD pour une mesure robuste de la dispersion résistante aux valeurs aberrantes.
FAQ du calculateur de dispersion
Quand dois-je utiliser l’IQR plutôt que l’écart-type ?
Utilisez l’IQR lorsque vos données sont asymétriques, contiennent des valeurs aberrantes ou proviennent d’une distribution non normale. L’IQR ne considère que les 50 % centraux des données et n’est pas affecté par les valeurs extrêmes. L’écart-type prend toutes les valeurs en compte, donc une seule valeur aberrante peut le gonfler fortement. Pour des données normalement distribuées sans valeurs aberrantes, les deux mesures sont informatives.
Quelle est la différence entre variance d’échantillon et variance de population ?
La variance de population divise la somme des écarts au carré par n (l’effectif total), ce qui convient lorsque vous disposez des données de toute la population. La variance d’échantillon divise par n−1 (correction de Bessel), ce qui corrige le biais lors de l’estimation de la variance de population à partir d’un échantillon. Pour les grands échantillons, la différence est négligeable ; pour les petits échantillons (n < 30), elle compte davantage.
Que m’indique le coefficient de variation ?
Le coefficient de variation (CV) exprime l’écart-type en pourcentage de la moyenne, ce qui fournit une mesure de variabilité relative indépendante de l’échelle. Un CV de 5 % signifie que les données sont relativement homogènes ; un CV de 50 % signifie une forte variabilité par rapport à la moyenne. Le CV est particulièrement utile pour comparer la variabilité de mesures exprimées dans des unités différentes, par exemple la régularité de deux procédés de fabrication.
Comment se calcule l’écart absolu médian (MAD) ?
Le MAD est la médiane des écarts absolus à la médiane : MAD = median(|xi − median(x)|). Il est plus résistant aux valeurs aberrantes que l’écart-type, car il utilise la médiane des écarts plutôt que leur moyenne. Une estimation robuste courante de l’écart-type est 1.4826 × MAD, ce qui est égal à l’écart-type pour une distribution normale.
Pourquoi la moyenne et la médiane peuvent-elles différer fortement ?
Lorsque la moyenne et la médiane diffèrent sensiblement, la distribution est asymétrique. Une moyenne beaucoup plus grande que la médiane indique une asymétrie à droite (quelques valeurs très grandes tirent la moyenne vers le haut). Une moyenne beaucoup plus petite que la médiane indique une asymétrie à gauche. Dans les distributions asymétriques, la médiane est généralement une meilleure mesure de tendance centrale que la moyenne, et l’IQR une meilleure mesure de dispersion que l’écart-type.
Puis-je utiliser ce calculateur pour de très grands jeux de données ?
Le calculateur gère n’importe quelle taille de jeu de données que vous pouvez saisir, mais les très grandes entrées peuvent être plus lentes à analyser. Pour de meilleures performances, utilisez des valeurs séparées par des virgules sur une seule ligne ou réparties sur plusieurs lignes. Les calculs utilisent des algorithmes numériquement stables qui évitent les débordements et les sous-flux pour les plages de données courantes. Si vous analysez des millions de valeurs, un outil statistique dédié comme R ou pandas en Python sera plus efficace.