Calculateur de distribution de fréquences - Créer des tableaux
Créez instantanément un tableau complet de distribution de fréquences à partir de n'importe quel jeu de données. Obtenez intervalles de classe, fréquences, fréquences relatives, fréquences cumulées et statistiques clés.
Collez ou saisissez vos nombres séparés par des virgules ou des espaces, choisissez le nombre d'intervalles de classe, puis cliquez sur Calculer pour générer le tableau complet et le résumé.
Calculateur de distribution de fréquences
Organise les données en intervalles de classe groupés avec fréquences et statistiques
Séparez les nombres avec des virgules, des espaces ou des retours à la ligne.
À propos du calculateur de distribution de fréquences
Une distribution de fréquences est un résumé tabulaire qui montre à quelle fréquence chaque valeur — ou chaque plage de valeurs — apparaît dans un jeu de données. En organisant les données brutes en un nombre maniable d'intervalles de classe et en comptant les observations dans chaque intervalle, un tableau de distribution de fréquences transforme une liste désordonnée de nombres en une image structurée de la forme, du centre et de la dispersion des données. Les distributions de fréquences sont un concept fondamental de la statistique descriptive et servent de base aux histogrammes, aux polygones de fréquence relative et aux courbes de fréquence cumulée.
Une distribution de fréquences groupée divise l'étendue des données en un nombre fixe d'intervalles de classe non superposés et de même largeur. Chaque intervalle a une borne inférieure, une borne supérieure et un milieu. La fréquence est le nombre de données qui tombent dans l'intervalle. La fréquence relative est la fréquence exprimée comme proportion (ou pourcentage) du total, ce qui facilite la comparaison entre des jeux de données de tailles différentes. La fréquence cumulée est la somme progressive des fréquences depuis la première classe jusqu'à la classe courante, et elle indique combien de données se trouvent au plus à la borne supérieure de chaque classe.
Le choix du nombre de classes est un équilibre : trop peu de classes fusionnent des motifs distincts en un seul bloc, tandis que trop de classes étalent les données au point qu'aucun schéma clair n'émerge. Une règle empirique courante est la règle de Sturges : k = 1 + 3.322 × log₁₀(n), où n est le nombre de données. Par exemple, 20 données suggèrent k ≈ 5 classes ; 100 données suggèrent k ≈ 7 classes. La largeur de classe est alors width = (max − min) / k, arrondie au supérieur à une valeur pratique pour que toutes les données entrent proprement.
Les statistiques résumées tirées d'une distribution de fréquences sont des approximations basées sur les données groupées plutôt que sur les valeurs individuelles. La moyenne groupée se calcule comme Σ(milieu × fréquence) / n. L'écart type groupé mesure la dispersion des données autour de la moyenne groupée. La médiane groupée est estimée par interpolation à l'intérieur de l'intervalle de classe contenant la n/2e observation. Ces approximations sont très proches des valeurs exactes calculées à partir des données brutes lorsque la largeur de classe est petite par rapport à l'étendue.
Les distributions de fréquences sont utilisées dans tous les domaines qui génèrent des données numériques. Les enseignants les emploient pour analyser des notes et repérer les élèves qui pourraient avoir besoin d'un soutien supplémentaire. Les entreprises analysent les montants des ventes, les notes des produits ou les temps d'attente des clients pour identifier les pics et les goulots d'étranglement. Les chercheurs en santé répartissent des mesures cliniques comme la tension artérielle, le cholestérol ou l'IMC pour comprendre l'état de santé des populations. Les ingénieurs qualité examinent les mesures issues des processus de production pour détecter des défauts ou des dérives. Dans chaque cas, le tableau de distribution de fréquences est le point de départ d'analyses plus avancées.
Distribution de fréquences — Exemples
Trois jeux de données pratiques montrant différentes structures de classes et statistiques résumées.
| Jeu de données | Structure | Contexte |
|---|---|---|
| 82,90,75,68,88,75,95,100,72,85,91,78,84,88,77,95,65,80,73,86 — 5 classes | Classes : [65,72), [72,79), [79,86) … ; Moyenne ≈ 82.85 | Notes d'élèves d'une classe de 20. Largeur de classe = 7. La plupart des notes se regroupent entre 72 et 93, avec une légère queue à gauche. |
| 150,220,180,190,250,160,200,210,170,240,195,175,215,185,230 — 6 classes | Classes : [150,170), [170,190), [190,210) … ; Moyenne ≈ 202.7 | Ventes quotidiennes. Largeur de classe = 20. La distribution montre que la plupart des jours se concentrent dans la fourchette 170–230 dollars. |
| 35,42,38,50,45,48,36,39,47,41,43,46,40,37,44,49,38,42,45,36 — 5 classes | Classes : [35,38), [38,41), [41,44) … ; Moyenne ≈ 42.1 | Hauteurs de plantes en cm dans une étude botanique. La distribution en cloche confirme un schéma de croissance approximativement normal. |
Comment utiliser le calculateur de distribution de fréquences
- Saisissez vos données numériques dans le champ 'Jeu de données'. Vous pouvez séparer les valeurs par des virgules, des espaces ou des retours à la ligne ; la calculatrice accepte toute combinaison de ces séparateurs.
- Choisissez le nombre de classes (bins) qui convient le mieux à votre jeu de données. Un bon point de départ est 5 classes pour les petits jeux de données (n < 30) et 7–10 pour les plus grands. Vous pouvez utiliser la règle de Sturges : k ≈ 1 + 3.322 × log₁₀(n).
- Cliquez sur 'Calculer'. Le calculateur trouve le minimum et le maximum, calcule la largeur de classe comme (max − min) / classes arrondie au supérieur, puis affecte chaque donnée à l'intervalle approprié.
- Lisez le tableau des fréquences. Chaque ligne affiche l'intervalle de classe, le milieu, la fréquence, la fréquence relative (en pourcentage du total) et la fréquence cumulée (somme progressive).
- Consultez les statistiques résumées sous le tableau pour voir la moyenne groupée, la médiane, l'écart type et la largeur de classe. Utilisez les boutons d'exemple pour tester la calculatrice avec des jeux de données préremplis.
Calculateur de distribution de fréquences — FAQ
Qu'est-ce qu'un tableau de distribution de fréquences ?
Un tableau de distribution de fréquences organise des données numériques brutes en groupes appelés intervalles de classe (ou bins) et compte combien de valeurs tombent dans chaque groupe. Il transforme une liste désordonnée en un résumé structuré montrant où les données se regroupent, à quel point elles sont dispersées et quelle est la forme générale de la distribution.
Comment choisir le nombre de classes ?
Une approche courante est la règle de Sturges : k = 1 + 3.322 × log₁₀(n), où n est la taille de l'échantillon. Cela donne environ 5 classes pour 20 données et environ 7 pour 100. Sinon, essayez : commencez avec 5 classes et augmentez jusqu'à ce que la distribution révèle un motif clair sans devenir trop bruitée. La plupart des manuels recommandent 5 à 15 classes.
Qu'est-ce que la fréquence relative et pourquoi est-elle utile ?
La fréquence relative est la proportion du total des observations qui tombe dans une classe : fréquence relative = fréquence de la classe / n total. Elle convertit les comptes en pourcentages, ce qui facilite la comparaison de distributions issues de jeux de tailles différentes. Par exemple, savoir que 35 % des notes se situent entre 70 et 80 est plus informatif que connaître seulement le nombre d'élèves lorsqu'on compare deux classes de tailles différentes.
Qu'est-ce que la fréquence cumulée ?
La fréquence cumulée est la somme progressive des fréquences depuis la première classe jusqu'à la classe courante. Elle indique combien de données se trouvent au plus à la borne supérieure de chaque classe. Par exemple, si la fréquence cumulée à la fin de la troisième classe est de 15 sur 20, alors 75 % des observations appartiennent aux trois premières classes. La fréquence cumulée est à la base de l'ogive (courbe de fréquence cumulée).
Pourquoi la moyenne et l'écart type sont-ils indiqués comme 'groupés' ?
Lorsque les données sont regroupées en intervalles de classe, les valeurs individuelles exactes sont perdues. La moyenne et l'écart type groupés sont calculés en utilisant le milieu de chaque classe comme valeur représentative, ce qui introduit une petite approximation. Ces estimations sont très précises lorsque la largeur de classe est petite par rapport à l'étendue, mais peuvent différer légèrement des statistiques calculées sur les données brutes.
Quelle est la différence entre histogramme de fréquence et histogramme de fréquence relative ?
Un histogramme de fréquence trace le nombre brut sur l'axe y, tandis qu'un histogramme de fréquence relative trace la proportion (ou le pourcentage). Les histogrammes de fréquence relative sont directement comparables entre jeux de tailles différentes et peuvent servir d'approximation empirique de la distribution de probabilité sous-jacente. La forme est identique dans les deux cas ; seule l'échelle de l'axe y change.