Calculateurs de Statistiques
Calculatrice de moyenne, médiane, mode


Calculatrice de moyenne, médiane, mode

Calculatrice pour la moyenne, la médiane et le mode en statistique. Utilisez cette calculatrice afin de trouver la moyenne, la médiane, le mode, l'étendue pour n'importe quelle série de données.

Résultat
Moyenne x̄ 16.75 Valeurs aberrantes 6, 33, 35
Médiane x̃ 15 Quartile Q1 12.5
Mode 15 est apparu 3 fois Quartile Q2 15
Portée 29 Quartile Q3 16
Minimum 6 Écart interquartile IQR 3.5
Maximum 35
Somme 201
Nombre n 12

Il y avait une erreur avec votre calcul.

Table des Matières

  1. Les mesures de la tendance centrale
  2. Calculatrice de la moyenne
  3. Moyenne pour l'échantillon et la population
  4. Exemple : calcul de la moyenne
  5. Calculatrice de la médiane
  6. Exemple : calcul de la médiane
  7. La différence entre la moyenne et la médiane
  8. Calculatrice de modes
  9. Exemple : calcul du mode
  10. Mesure de la dispersion
  11. Calculatrice de l'étendue
  12. Exemple : calcul de l'étendue
  13. Calculatrice de quartiles
    1. Calcul des quartiles
  14. Exemple : calcul de quartiles
  15. Calculatrice de l'écart interquartile
  16. Exemple : calcul de l'EI
  17. Résultats

Calculatrice de moyenne, médiane, mode

Les mesures de la tendance centrale

Interpréter des tableaux et des graphiques de données statistiques peut nous paraitre difficile. On doit souvent synthétiser les séries de données et identifier les caractéristiques importantes afin d'améliorer la qualité des informations obtenues à partir de statistiques.

En statistique, on utilise différentes mesures pour faire la synthèse de données. Certaines décrivent le centre des données ; on les appelle des mesures de la tendance centrale. D'autres nous disent à quel point les valeurs des données sont dispersées ; on les appelle des mesures de dispersion. D'autres, appelées mesures de position, mettent en évidence la proportion de données qui sont inférieures à une valeur donnée.

L'objectif principal de cette calculatrice est de calculer des mesures de la tendance centrale (la moyenne et la médiane) qui peuvent représenter la valeur type ou centrale d'une série de données. Le deuxième objectif de cette calculatrice est de déterminer le degré de variation dans une série de données en calculant l'étendue, les quartiles et l'écart interquartile.

Calculatrice de la moyenne

La moyenne est la somme des valeurs divisée par le nombre total de valeurs. Cela se comprend et se calcule plus facilement en utilisant la formule suivante qui permet de calculer la moyenne pour un échantillon :

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$

La formule de la moyenne pour la population est la suivante :

$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$

Ici, le numérateur représente la somme des valeurs de la série de données. Et le dénominateur représente le nombre de valeurs dans la série de données.

La caractéristique principale lorsqu'on utilise la moyenne arithmétique est qu'elle implique tous les points présents dans la série de données.

La principale limite de la moyenne est qu'elle est sensible aux valeurs extrêmes qui sont soit trop grandes, soit trop petites. Ces valeurs sont connues sous le nom de valeurs aberrantes et elles impactent la moyenne de façon significative.

Notez également que la valeur moyenne n'est pas nécessairement la valeur type des données. La valeur moyenne peut être une valeur qui n'est pas du tout présente dans la série de données.

Moyenne pour l'échantillon et la population

La population se compose de l'ensemble des valeurs pour lesquelles des informations sont obtenues. L'échantillon se compose d'un groupe plus restreint prélevé dans la population.

La méthode pour calculer la valeur moyenne est la même pour les échantillons et les populations. Seules les façons dont elles sont désignées diffèrent.

Si x₁, x₂,..., xₙ est un échantillon, la moyenne s'appelle la moyenne de l'échantillon et elle est représentée par le symbole x̄. La moyenne de la population est indiquée par la lettre grecque 𝜇.

En statistique, nous utilisons la lettre minuscule n pour indiquer la taille de l'échantillon et la lettre majuscule N pour indiquer la taille de la population.

Exemple : calcul de la moyenne

Prenons l'exemple suivant : Luigi est un chef et un amateur de pizza de premier ordre. Il a décidé d'ouvrir sa pizzeria à Bali. Pour trouver un investisseur, Luigi rédige un plan d'affaires. Il veut déterminer le coût moyen des pizzas dans différents restaurants de l'île afin d'évaluer ses futurs résultats financiers.

Il a fait une petite recherche sur le prix de la pizza Margherita dans les restaurants de Bali et il a obtenu une série de données sur les prix des pizzas. Pour faciliter le calcul, nous ne prendrons pas en compte les trois derniers zéros et nous utiliserons le nombre de milliers dans le prix. Autrement dit, dans nos calculs, 60 signifieront 60.000 roupies indonésiennes.

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

Luigi n'a pas fait le tour de toutes les pizzerias de l'île. Il en a choisi 20 au hasard. Nous avons donc affaire à un échantillon.

Calculons la valeur moyenne de cette série de données à l'aide de la formule :

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$

On se retrouve avec la moyenne x̄ = 71,9.

Les recherches de Luigi montrent que le prix moyen d'une pizza Margherita à Bali est de 71.900 roupies indonésiennes. Il peut maintenant baser ses calculs sur ce prix.

Calculatrice de la médiane

La médiane est une mesure de position représentant la valeur moyenne d'une série de données disposées par ordre croissant ou décroissant.

En calculant la médiane, nous essayons de trouver un nombre qui divise en deux la série de données. La moitié des valeurs des données est inférieure à la médiane et la moitié est supérieure à la médiane. C'est la raison pour laquelle lorsque nous déterminons manuellement la médiane sans la calculatrice de la médiane, nous devons classer les valeurs par ordre croissant ou décroissant.

Le calcul de la médiane diffère selon que le nombre de valeurs dans la série de données est pair ou impair.

Si le nombre total d'éléments est impair, c'est-à-dire que n ou N est impair, alors la formule suivante s'applique :

$$Médiane=(\frac{n+1}{2})-me\ élément$$

Cependant, si le nombre d'éléments est pair, ce qui signifie que n est un nombre pair, alors la formule suivante est utilisée :

$$Médiane=\frac{\left[(\frac{n}{2})-me\ élément+(\frac{n}{2}+1)-me\ élément\right]}{2}$$

Le principal avantage d'utiliser la médiane est qu'elle est moins impactée par des valeurs extrêmement élevées ou extrêmement faibles.

Exemple : calcul de la médiane

Pour un ensemble donné de vingt valeurs,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

On peut calculer la médiane comme suit :

  1. Classez la série de données soit de façon croissante soit de façon décroissante. L'ordre est le suivant :

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. Déterminez le nombre de valeurs dans la série de données. Nous avons n = 20.

  2. Si n est impair, on choisit la valeur centrale des données comme médiane. Si n est pair, on trouve la moyenne arithmétique des deux valeurs médianes. Additionnez-les et divisez la somme par 2.

20 est un nombre pair.

Les valeurs centrales de notre échantillon sont 69 et 70. On trouve la médiane de cette façon :

$$Médiane = \frac{69 + 70}{2} = 69,5$$

Si Luigi avait une série de 21 valeurs, par exemple,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70

Il pourrait classer les valeurs :

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160

Et sélectionner la valeur au milieu à la 11e position, c'est-à-dire 70.

La différence entre la moyenne et la médiane

La moyenne et la médiane sont toutes deux utilisées comme mesures de la tendance centrale. Mais il est essentiel de savoir en quoi elles diffèrent.

Une différence cruciale entre la moyenne et la médiane est que la formule de la moyenne utilise toutes les valeurs de la série de données. En revanche, la formule de la médiane ne dépend que du nombre central ou de deux des nombres centraux.

Ceci est particulièrement important pour les séries de données qui possèdent un ou plusieurs nombres exceptionnellement grands ou exceptionnellement petits. On appelle ces nombres des valeurs aberrantes. Dans la plupart des cas, ces valeurs aberrantes auront un impact significatif sur la moyenne, mais elles n'auront que peu ou pas d'effet sur la médiane.

En statistique, nous disons qu'une mesure est résistante si sa valeur n'est pas fortement impactée par des valeurs extrêmes dans la série de données. On peut donc dire que la médiane est résistante et que la moyenne n'est pas résistante.

La moyenne et la médiane mesurent différemment le milieu de la série de données. La moyenne est le point auquel la série de données s'équilibre. La médiane est la moyenne qui sépare 50 % des données d'un côté de 50 % des données de l'autre côté. Lorsque la série de données est symétrique, la moyenne et la médiane sont égales.

Mais la moyenne et la médiane peuvent ne pas être égales.

Dans certaines séries de données, la moyenne peut être inférieure à la médiane ou la médiane peut être inférieure à la moyenne. Dans ce cas, nous disons que la série de données est asymétrique.

Si la valeur de la moyenne est positionnée à gauche de la médiane ou si elle est inférieure à la médiane, nous disons que la série de données est étalée à gauche. Si la moyenne est positionnée à droite de la médiane ou si elle est supérieure à la médiane, nous disons que la série de données est étalée à droite.

Ni la moyenne ni la médiane ne mesurent mieux la tendance centrale. Elles mesurent toutes les deux le milieu de différentes manières. Certains experts préfèrent utiliser la médiane lorsque les données sont fortement asymétriques ou qu'elles contiennent des valeurs extrêmes parce que la médiane est plus représentative d'une valeur type.

Calculatrice de modes

Un mode c'est la valeur d'une série de données qui apparait un maximum de fois dans la série. C'est la valeur qui apparait le plus fréquemment.

Une série de données dans laquelle une seule valeur apparait le plus souvent s'appelle une série unimodale.

Si dans une série de données, il existe deux valeurs qui ont la même fréquence maximum, alors ces deux valeurs sont considérées comme modales et on considère que la série est bimodale.

Si dans une série de données, il existe plus de deux valeurs qui ont la même fréquence maximum, alors chacune des valeurs est utilisée comme mode et on considère que la série est multimodale.

Lorsqu'aucune valeur n'apparait plus d'une fois, on dit que la série de données n'a pas de mode. Dans ce cas, il ne serait pas juste de dire que le mode est nul. En effet, zéro peut être une vraie valeur dans certaines séries de données, comme pour les mesures de la température.

Le principal avantage de calculer un mode est qu'il est plus facile à trouver et qu'il n'est pas impacté par des valeurs extrêmes. L'inconvénient de calculer un mode est que, dans certaines situations, il peut ne pas exister de valeur de mode pour des séries de données.

Exemple : calcul du mode

Pour un ensemble donné de vingt valeurs,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

On peut trouver le mode comme indiqué ci-dessous.

Classez la série de données dans l'ordre croissant ou décroissant. Dans notre exemple, l'ordre est le suivant :

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

Ensuite, on trouve la valeur qui se répète un maximum de fois. Ici, la valeur la plus fréquente est 70. Ainsi, pour la série de données fournie, la valeur modale est 70.

On considère également le mode comme une mesure de la tendance centrale. Mais ce n’est pas tout à fait exact. Le mode peut être la plus grande valeur, la plus petite valeur ou toute autre valeur de la série de données. Par exemple, si nous avions les nombres suivants dans la série de données :

42, 45, 50, 53, 55, 57, 59, 60, 63, 69, 70, 72, 79, 82, 83, 95, 96, 120, 120, 120

Le mode serait 120. Bien que dans ce cas, cela ne refléterait pas la tendance centrale.

Il est intéressant de noter que nous pouvons uniquement calculer la moyenne et la médiane de données quantitatives. Et nous pouvons calculer le mode à la fois pour les données quantitatives et les données qualitatives.

Par exemple, Anna mange de la pizza en moyenne 12 fois par mois.

  • 3 fois une pizza Napolitaine,
  • 3 fois une pizza Margherita,
  • 2 fois une pizza Calzone,
  • 1 Peppéroni,
  • 1 Marinara,
  • 1 Quatre fromages,
  • 1 Caprese.

Dans ce cas, nous aurons deux modes : la pizza Napolitaine et la pizza Margherita.

Mesure de la dispersion

Nous utilisons des mesures de la variance pour déterminer la variabilité d'une série de données. Elles reflètent généralement le degré de variation des données par rapport à la valeur centrale. Nous pouvons examiner la variance dans une série de données en utilisant l'étendue, les quartiles et l'écart interquartile.

Calculatrice de l'étendue

L'étendue d'une série de données est la différence entre la valeur la plus élevée et la valeur la plus basse de la série de données. Nous pouvons la calculer en déterminant les valeurs maximale et minimale de la série de données. La formule pour calculer l'étendue est la suivante :

$$Gamme = La\ plus\ grande\ valeur - La\ plus\ petite\ valeur$$

Exemple : calcul de l'étendue

Pour un ensemble donné de vingt valeurs,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

On peut calculer l'étendue comme indiqué ci-dessous.

Classez la série de données dans l'ordre croissant ou décroissant. Dans notre exemple, l'ordre ressemble à cela :

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

En outre, la valeur la plus élevée est 160 et la valeur la plus basse est 42. D'où l'étendue :

$$Gamme = La\ plus\ grande\ valeur - La\ plus\ petite\ valeur = 160 - 42 = 118$$

Par conséquent, pour cette série de données, l'étendue est de 118.

Calculatrice de quartiles

Les quartiles sont des valeurs qui divisent la série de données en quatre quarts par trois points, à savoir le premier, le deuxième et le troisième quartile.

Le premier quartile, noté Q₁, représente le point pour lequel les 25 % initiaux des valeurs de la série de données se trouvent sous cette valeur. Et les 75 % restants se situent au-dessus.

Le deuxième quartile, noté Q₂, est la médiane. Cela signifie que 50 % de la série de données sont inférieurs à cette valeur et les 50 % restants sont supérieurs à Q₂.

Le troisième quartile, noté Q₃, est le point pour lequel 75 % des valeurs se trouvent sous cette valeur et les 25 % restantes se situent au-dessus.

Calcul des quartiles

Une méthode pour calculer les quartiles d'une série de données :

  1. Disposez les données dans l'ordre croissant.

  2. Pour calculer le deuxième quartile, calculez la médiane.

  3. Pour les premier et troisième quartiles, procédez comme suit. Déterminez n, le nombre de valeurs dans la série de données.

  4. Pour le premier quartile, calculer L = 0,25n. Pour le troisième quartile, calculer L = 0,75n.

  5. Si L est un entier, le quartile est la moyenne du nombre en position L et du nombre en position L + 1.

  6. Si L n'est pas un entier, arrondissez-le à l'entier supérieur suivant. Le quartile est le nombre qui se trouve à la position correspondant à la valeur arrondie.

Exemple : calcul de quartiles

Pour un ensemble donné de vingt valeurs,

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

Nous pouvons calculer les quartiles comme suit :

  1. Classez la série de données soit de façon croissante, soit de façon décroissante. Dans notre exemple, voici à quoi cela ressemble :

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. D'après les calculs précédents, nous savons déjà que

Médiane = 70

  1. L pour le premier quartile : 0,25 × 20 = 5. L pour le troisième quartile : 0,75 × 20 = 15.

  2. 5 est un entier et donc, dans notre cas, Q₁ est :

$$Q₁=\frac{55+59}{2}=57$$

  1. 15 est aussi un entier et donc, dans notre cas, Q₃ est

$$Q₃=\frac{72+75}{2}=73,5$$

Par conséquent, pour cette série de données, le premier quartile est 57, le deuxième est 70 et le troisième est 73,5.

Calculatrice de l'écart interquartile

L'écart interquartile (EI) est la différence entre le troisième $(Q₃)$ et le premier Q₁ quartile d'une série de données. Il s'agit d'une mesure de la dispersion moyenne, qui peut être calculée comme suit :

EI = Q₃ - Q₁

Exemple : calcul de l'EI

Dans la section précédente, nous avons déjà calculé les premier et troisième quartiles. Ce sont 57 et 73,5. Tout ce que nous avons à faire, c'est simplement appliquer la formule.

EI = Q₃ - Q₁ = 73,5 - 57 = 16,5

Ainsi, pour cette série de données, l'écart interquartile est de 16,5.

Résultats

Dans notre cas, grâce à sa mini enquête sur le prix des pizzas Margherita, Luigi a pu tirer les conclusions suivantes : la moyenne et la médiane ne correspondaient pas ; il s'est formé une légère asymétrie dans les données. Mais cela ne se voit pas trop. Ainsi, la moyenne et la médiane ont pu être utilisées pour mesurer la tendance centrale.

Si Luigi voulait continuer avec le prix moyen d'une pizza Margherita, il aurait dû prendre soit la moyenne, soit la médiane. Mais ce n'aurait pas été très pratique de se souvenir de 71.900 ou 69.500 roupies comme prix de pizza. Heureusement, le prix de la pizza Margherita, qui est de 70.000 roupies indonésiennes, est juste dans cette fourchette. Par conséquent, Luigi aurait pu utiliser ce chiffre rond dans ses calculs.

S'il voulait faire une pizzeria pour un groupe cible plus économe, il aurait pu se concentrer sur des chiffres plus proches du premier quartile. C'est à dire un prix d'environ 57.000 roupies indonésiennes. S’intéresser au troisième quartile afin de déterminer le prix pour des clients plus exigeants ne convient pas parce que le troisième quartile n'est pas vraiment représentatif.