Distribution normale dans les statistiques - Définition, exemple, interprétation

Qu'est-ce que la distribution normale dans les statistiques?

La distribution normale est une courbe de distribution de fréquence en forme de cloche qui aide à décrire toutes les valeurs possibles qu'une variable aléatoire peut prendre dans une plage donnée, la majeure partie de la zone de distribution étant au milieu et peu se trouvant dans les queues, aux extrêmes. Cette distribution a deux paramètres clés: la moyenne (µ) et l'écart type (σ) qui jouent un rôle clé dans le calcul du rendement des actifs et dans la stratégie de gestion des risques.

Comment interpréter la distribution normale

La figure ci-dessus montre que la distribution statistique normale est une courbe en forme de cloche. La gamme des résultats possibles de cette distribution est l'ensemble des nombres réels compris entre -∞ et + ∞. Les queues de la courbe en cloche s'étendent des deux côtés du graphique (+/-) sans limites.

  • Environ 68% de toutes les observations se situent à +/- un écart-type (σ)
  • Environ 95% de toutes les observations se situent à +/- deux écarts types (σ)
  • Environ 99% de toutes les observations se situent à +/- trois écarts types (σ)

Il a une asymétrie de zéro (symétrie d'une distribution). Si la distribution des données est asymétrique, alors la distribution est inégale si l'ensemble de données a une asymétrie supérieure à zéro ou une asymétrie positive. Ensuite, la queue droite de la distribution est plus prolongée que la gauche, et pour une asymétrie négative (inférieure à zéro), la queue gauche sera plus longue que la queue droite.

Il a un kurtosis de 3 (mesure le pic d'une distribution), ce qui indique que la distribution n'est ni trop pointue ni trop fine. Si le kurtosis est supérieur à trois, la distribution est plus pointue avec des queues plus grosses, et si le kurtosis est inférieur à trois, alors il a des queues minces et le point de pic est inférieur à la distribution normale.

Caractéristiques

  • Ils représentent une famille de distribution où la moyenne et l'écart déterminent la forme de la distribution.
  • La moyenne, la médiane et le mode de cette distribution sont tous égaux.
  • La moitié des valeurs sont à gauche du centre et l'autre moitié à droite.
  • La valeur totale sous la courbe standard sera toujours de un.
  • Très probablement, la distribution est au centre et moins de valeurs se trouvent à l'extrémité arrière.

Transformation (Z)

La fonction de densité de probabilité (PDF) d'une variable aléatoire (X) suivant la distribution est donnée par:

où -∞ <x <∞; -∞ <µ 0

Où,

  • F (x) = Fonction de probabilité normale
  • x = variable aléatoire
  • µ = Moyenne de distribution
  • σ = écart type de la distribution
  • π = 3,14159
  • e = 2,71828

Formule de transformation

Où,

  • X = variable aléatoire

Exemples de distribution normale dans les statistiques

Discutons des exemples suivants.

Exemple 1

Supposons qu'une entreprise compte 10000 employés et une structure de salaires multiples selon le poste dans lequel travaille l'employé. Les salaires sont généralement répartis avec la moyenne de la population µ = 60 000 $ et l'écart-type de la population σ = 15 000 $. Quelle sera la probabilité qu'un employé choisi au hasard ait un salaire annuel inférieur à 45 000 $.

Solution

Comme le montre la figure ci-dessus, pour répondre à cette question, nous devons trouver l'aire sous la courbe normale de 45 à la queue du côté gauche. De plus, nous devons utiliser la valeur de la table Z pour obtenir la bonne réponse.

Premièrement, nous devons convertir la moyenne et l'écart type donnés en une distribution normale standard avec moyenne (µ) = 0 et écart-type (σ) = 1 en utilisant la formule de transformation.

Après la conversion, nous devons rechercher la table Z pour trouver la valeur correspondante, ce qui nous donnera la bonne réponse.

Donné,

  • Moyenne (µ) = 60 000 USD
  • Écart type (σ) = 15000 $
  • Variable aléatoire (x) = 45 000 $

Transformation (z) = (45000 - 60000/15000)

Transformation (z) = -1

Maintenant, la valeur qui équivaut à -1 dans la table Z est 0,1587, ce qui représente la zone sous la courbe de 45 à gauche. Il indique que lorsque nous sélectionnons un employé au hasard, la probabilité de gagner moins de 45 000 $ par année est de 15,87%.

Exemple # 2

Maintenant, en gardant le même scénario que ci-dessus, découvrez la probabilité qu'un employé sélectionné au hasard gagne plus de 80 000 $ par an en utilisant la distribution normale.

Solution

Donc, dans cette question, nous devons trouver la zone ombrée de 80 à la queue droite en utilisant la même formule.

Donné,

  • Moyenne (µ) = 60 000 USD
  • Écart type (σ) = 15000 $
  • Variable aléatoire (X) = 80 000 $

Transformation (z) = (80000 - 60000/15000)

Transformation (z) = 1,33

Selon le tableau Z, la valeur équivalente de 1,33 est 0,9082 ou 90,82%, ce qui montre que la probabilité de sélectionner au hasard des employés gagnant moins de 80 000 $ par année est de 90,82%.

Mais selon la question, nous devons déterminer la probabilité que les employés aléatoires gagnent plus de 80 000 $ par an, nous devons donc soustraire la valeur de 100.

  • Variable aléatoire (X) = 100% - 90,82%
  • Variable aléatoire (X) = 9,18%

La probabilité que les employés gagnent plus de 80 000 $ par année est donc de 9,18%.

Les usages

  • Le graphique technique du marché boursier est souvent une courbe en cloche, permettant aux analystes et aux investisseurs de faire des inférences statistiques sur le rendement attendu et le risque des actions.
  • Il est utilisé dans le monde réel, comme pour déterminer le meilleur temps le plus probable pris par les entreprises de pizza pour livrer des pizzas et bien d'autres applications réelles.
  • Utilisé pour comparer les hauteurs d'un ensemble de population donné dans lequel la plupart des gens auront une taille moyenne et très peu de personnes auront une taille supérieure ou inférieure à la moyenne.
  • Ils sont utilisés pour déterminer le rendement scolaire moyen des étudiants, ce qui permet de comparer le rang des étudiants.

Conclusion

La distribution normale trouve des applications dans la science des données et l'analyse des données. Les technologies avancées telles que l'intelligence artificielle et l'apprentissage automatique utilisées avec cette distribution peuvent donner une meilleure qualité des données, ce qui aidera les particuliers et les entreprises à prendre des décisions efficaces.

Articles intéressants...