Formule aberrante - Calcul pas à pas des valeurs aberrantes (avec exemple)

La formule aberrante fournit un outil graphique pour calculer les données qui sont situées à l'extérieur de l'ensemble donné de distribution qui peut être du côté intérieur ou extérieur en fonction des variables.

Quelle est la formule aberrante?

Une valeur aberrante est le point de données de l'échantillon donné ou de l'observation donnée ou dans une distribution qui doit se trouver en dehors du modèle global. Règle couramment utilisée qui dit qu'un point de données sera considéré comme une valeur aberrante s'il a plus de 1,5 IQR en dessous du premier quartile ou au-dessus du troisième quartile.

Autrement dit, les valeurs aberrantes basses doivent être inférieures à Q1-1,5 IQR et les valeurs aberrantes élevées doivent se situer Q3 + 1,5IQR

Il faut calculer la médiane, les quartiles, y compris IQR, Q1 et Q3.

La formule aberrante est représentée comme suit,

La formule pour Q1 = ¼ (n + 1) e terme  La formule pour Q3 = ¾ (n + 1) e terme  La formule pour Q2 = Q3 - Q1

Calcul étape par étape des valeurs aberrantes

Les étapes ci-dessous doivent être suivies pour calculer la valeur aberrante.

  • Étape 1: Calculez d'abord les quartiles, c'est-à-dire Q1, Q2 et interquartile
  • Étape 2: Calculez maintenant la valeur Q2 * 1,5
  • Étape 3: Soustrayez maintenant la valeur Q1 de la valeur calculée à l'étape 2
  • Étape 4: Ajoutez ici Q3 avec la valeur calculée à l'étape 2
  • Étape 5: Créez la plage des valeurs calculées aux étapes 3 et 4
  • Étape 6: Organisez les données par ordre croissant
  • Étape 7: Vérifiez s'il existe des valeurs inférieures ou supérieures à la plage créée à l'étape 5.

Exemple

Considérez un ensemble de données des nombres suivants: 10, 2, 4, 7, 8, 5, 11, 3, 12. Vous devez calculer toutes les valeurs aberrantes.

Solution:

Tout d'abord, nous devons organiser les données par ordre croissant pour trouver la médiane, qui sera pour nous Q2.

2, 3, 4, 5, 7, 8, 10, 11, 12

Maintenant que le nombre d'observations est impair, qui est de 9, la médiane se situerait sur une 5 e position, qui est de 7, et la même chose sera Q2 pour cet exemple.

Par conséquent, le calcul de Q1 est le suivant -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 sera -

Q1 = 2,5 terme

Cela signifie que Q1 est la moyenne des 2 ème et 3 ème position des observations, ce qui est 3 et 4 ici, et une moyenne de celui - ci est (3 + 4) / 2 = 3,5

Par conséquent, le calcul de Q3 est le suivant -

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 sera -

Q3 = 7,5 terme

Cela signifie que Q3 est la moyenne des 7 e et 8 e positions des observations, qui est ici 10 & 11, et une moyenne de la même chose est (10 + 11) / 2 = 10,5

Désormais, les valeurs aberrantes basses doivent être inférieures à Q1-1.5IQR et les valeurs aberrantes élevées doivent se situer à Q3 + 1.5IQR

Ainsi, les valeurs sont 3,5 - (1,5 * 7) = -7 et la plage supérieure est 10,5 + (1,5 * 7) = 110,25.

Puisqu'il n'y a aucune observation supérieure ou inférieure à 110,25 et -7, nous n'avons aucune valeur aberrante dans cet échantillon.

Exemple de formule aberrante dans Excel (avec modèle Excel)

Les cours de coaching créatif envisagent de récompenser les étudiants qui sont dans le top 25%. Cependant, ils veulent éviter les valeurs aberrantes. Les données concernent les 25 étudiants. Utilisez l'équation aberrante pour déterminer s'il existe une valeur aberrante?

Solution:

Vous trouverez ci-dessous des données pour calculer la valeur aberrante.

Le nombre d'observations ici est de 25, et notre première étape consisterait à convertir les données brutes ci-dessus par ordre croissant.

La médiane sera -

La valeur médiane = ½ (n + 1)

= ½ = ½ (26)

= 13 e trimestre

Le Q2 ​​ou médiane est de 68,00

Ce qui représente 50% de la population.

Q1 sera -

Q1 = ¼ (n + 1) e terme

= ¼ (25 + 1)

= ¼ (26)

= 6,5 e terme, ce qui équivaut au 7 e terme

Le Q1 est de 56,00, ce qui est le plus bas 25%

Q3 sera -

Enfin, Q3 = ¾ (n + 1) ème terme

= ¾ (26)

= 19,50 terme

Ici, la moyenne doit être prise, qui est des 19 e et 20 e trimestres qui sont 77 et 77 et la moyenne de la même chose est (77 + 77) / 2 = 77,00

Le Q3 est 77, ce qui est le top 25%

Bas de gamme

Désormais, les valeurs aberrantes basses doivent être inférieures à Q1-1.5IQR et les valeurs aberrantes élevées doivent se situer à Q3 + 1.5IQR

Haut de gamme -

Ainsi, les valeurs sont 56 - (1,5 * 68) = -46 et la plage supérieure est 77 + (1,5 * 68) = 179.

Il n'y a pas de valeurs aberrantes.

Pertinence et utilisations

Il est très important de connaître la formule des valeurs aberrantes car il pourrait y avoir des données qui seraient faussées par une telle valeur. Prenons un exemple des observations 2, 4, 6, 101, et maintenant si quelqu'un prend une moyenne de ces valeurs, ce sera 28,25, mais 75% des observations se situent en dessous de 7, et par conséquent, une décision serait incorrecte concernant les observations de cet échantillon.

On peut remarquer ici que 101 semble clairement décrire, et si cela est supprimé, la moyenne serait de 4, ce qui indique que les valeurs ou les observations se situent dans la plage de 4. Par conséquent, il est très important de procéder à cette calcul pour éviter toute mauvaise utilisation des informations de tête des données. Ces derniers sont largement utilisés par les statisticiens du monde entier lorsqu'ils mènent des recherches.

Articles intéressants...