Moyenne vs médiane - Différences entre les méthodes utilisées dans les statistiques

Différence entre la moyenne et la médiane

La moyenne et la médiane sont deux termes couramment utilisés en mathématiques, la moyenne est comme la moyenne d'un nombre donné et elle résume les nombres et les divise avec le nombre de nombres qui nous donne la moyenne tandis que la médiane renvoie le nombre du milieu à partir du tout ensemble de données et si l'ensemble de données est pair, la médiane ajoute les deux nombres du milieu et la divise par 2, ce qui nous donne la médiane.

Ils sont la mesure de la tendance centrale et sont souvent utilisés dans la mesure de grands ensembles de données où l'analyse doit être tirée et les résultats interprétés. La moyenne, la médiane et le mode sont trois mesures de moyennes qui montrent que la dispersion des données provient de la moyenne ou de la moyenne. Ces méthodes sont largement utilisées dans les statistiques, alors que la valeur moyenne des données est la méthode la plus utilisée parmi les trois.

Qu'est-ce que Mean?

La moyenne est une simple somme des nombres d'observations dans un tableau, qui est divisée par le nombre d'observations. Par exemple, si nous parlons de la taille moyenne ou de la taille moyenne d'un groupe composé de 5 personnes. La taille moyenne serait calculée en additionnant la taille de 5 personnes divisée par le nombre de personnes, soit 5.

Formule

Formule moyenne = (Somme de toutes les observations / nombre d'observations)

Quelle est la médiane?

La médiane, en revanche, est le nombre du milieu dans l'ensemble du tableau de données, qui sépare l'ensemble supérieur de données de l'ensemble inférieur. Les données doivent d'abord être classées par ordre croissant pour calculer la médiane des données. Lorsque l'ensemble de données a une cardinalité, la moyenne des deux nombres du milieu de l'ensemble de données doit être prise. Cependant, ces deux méthodes sont souvent utilisées de manière interchangeable.

Formule

Formule médiane = (n + 1) / 2

quand n est un nombre impair

Médiane = ((n / 2) + ((n / 2) +1)) / 2

quand n est un nombre pair

Infographie moyenne vs médiane

Voyons les principales différences entre la moyenne et la médiane.

Différences clés moyennes et médianes

  • Mean est simple à utiliser et à appliquer et peut être appliqué à n'importe quel ensemble de tableaux de données, qu'il soit pair ou impair. La médiane, en revanche, est légèrement complexe à utiliser et l'ensemble de données doit être organisé dans l'ordre croissant ou décroissant avant le calcul.
  • La moyenne est normalement utilisée pour les distributions normales, tandis que la médiane est utilisée pour l'ensemble de données des distributions asymétriques.
  • La moyenne est simple, mais elle n'est pas robuste car elle peut contenir des valeurs aberrantes dans les distributions et parfois ne pas donner à l'utilisateur les bons résultats pour l'interprétation. D'autre part, la méthode de la médiane est robuste et est mieux adaptée à l'utilisation car elle est utilisée pour les distributions asymétriques pour dériver la tendance centrale de l'ensemble de dates et donnera à l'utilisateur de nombreux résultats précis par rapport à la moyenne
  • Il n'y a qu'une seule formule de moyenne qui est la somme de toutes les observations divisée par le nombre d'observations. Alors que la médiane a deux formules, l'une des impairs où seuls les nombres du milieu de l'ensemble de données deviennent la médiane. Mais lorsque nous avons un ensemble de données pair, le milieu des deux valeurs est choisi et divisé par 2, ce qui nous donne alors la médiane de l'ensemble de données pair.

Tableau comparatif moyen vs médian

Signifier Médian
La moyenne est calculée en additionnant toutes les valeurs du tableau de données, qui est ensuite divisée par le nombre d'observations. La médiane est la valeur médiane exacte de l'ensemble de données. Il peut être calculé en organisant l'ensemble de données dans l'ordre croissant, puis en recherchant ou en sélectionnant la valeur médiane de l'ensemble de données.
Il est plus largement utilisé dans l'industrie en raison d'un calcul facile de la moyenne, et il nous donne un chiffre rapide. Il n'est pas souvent utilisé dans l'industrie, mais il est plus complet et précis que la moyenne, qui n'est qu'une simple somme de nombres.
Il est généralement utilisé pour un ensemble de données normalement asymétrique, c'est-à-dire une distribution normale. Il est particulièrement pratique de décrire l'ensemble de données avec une asymétrie significative dans les données ou lorsque les données ont une longue queue. Il est largement utilisé lorsque les outliners ont un poids significatif dans les données, ce qui signifie que ce n'est pas une bonne méthode de calcul.
Ce n'est pas un outil robuste pour un calcul pour dériver la tendance centrale. C'est un outil très robuste car il détermine le poids dans les données, qui est généralement un poids élevé aux queues les plus longues.
Il est très sensible aux valeurs aberrantes. Il est beaucoup moins affecté par les valeurs aberrantes.
C'est simple à utiliser Il est de nature complexe.
Il ne peut pas être calculé pour des données catégorielles, car les valeurs ne peuvent pas être additionnées. Il ne peut pas être identifié pour les données nominales catégorisées car il ne peut pas être ordonné logiquement.

Conclusion

Outre la moyenne et la médiane, il existe une autre méthode souvent utilisée pour mesurer la tendance centrale qui est le mode. Un mode est une valeur qui apparaît le plus fréquemment dans l'ensemble de données; le mode a un avantage sur la moyenne et la médiane qu'il peut être trouvé pour les ensembles de données numériques et catégorisés.

Malgré l'existence d'un mode et d'une médiane, la supériorité de meilleurs résultats et analyses sur la moyenne, la moyenne reste la mesure la plus appropriée de la tendance centrale, surtout si l'ensemble de données est une distribution normale et que les données sont normalement biaisées.

En tant que bon analyste, la tendance centrale doit être mesurée avec les trois méthodes de données, et la variance de l'analyse doit être réfléchie et soigneusement analysée pour produire des résultats meilleurs et plus précis dans l'ensemble de données.

Articles intéressants...