Distribution hypergéométrique (définition, formule) - Comment calculer?

Définition de la distribution hypergéométrique

Dans les statistiques et la théorie des probabilités, la distribution hypergéométrique est fondamentalement une distribution de probabilité distincte qui définit la probabilité de k succès (c'est-à-dire certains tirages aléatoires pour l'objet dessiné qui a une caractéristique spécifiée) en n pas de tirages, sans aucun remplacement, à partir d'un taille de population N qui comprend exactement K objets ayant cette caractéristique, où le tirage peut réussir ou échouer.

La formule de probabilité d'une distribution hypergéométrique est dérivée à l'aide d'un certain nombre d'éléments dans la population, du nombre d'éléments dans l'échantillon, du nombre de succès dans la population, du nombre de succès dans l'échantillon et de quelques combinaisons. Mathématiquement, la probabilité est représentée par,

P = K C k * (N - K) C (n - k) / N C n

où,

  • N = nombre d'articles dans la population
  • n = nombre d'items de l'échantillon
  • K = Nombre de succès dans la population
  • k = nombre de succès dans l'échantillon

La moyenne et l'écart type d'une distribution hypergéométrique sont exprimés comme suit:

Moyenne = n * K / N Écart type = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Explication

Étape 1: Tout d'abord, déterminez le nombre total d'articles dans la population, qui est indiqué par N. Par exemple, le nombre de cartes à jouer dans un jeu est de 52.

Étape 2: Ensuite, déterminez le nombre d'éléments dans l'échantillon, indiqué par n - par exemple, le nombre de cartes tirées du jeu.

Étape 3: Ensuite, déterminez les instances qui seront considérées comme des réussites dans la population, et cela est indiqué par K. Par exemple, le nombre de cœurs dans le jeu global, qui est de 13.

Étape 4: Ensuite, déterminez les instances qui seront considérées comme des réussites dans l'échantillon tiré, et cela est noté k. Par exemple, le nombre de cœurs dans les cartes tirées du jeu.

Étape 5: Enfin, la formule de probabilité d'une distribution hypergéométrique est dérivée en utilisant un certain nombre d'items dans la population (étape 1), le nombre d'items dans l'échantillon (étape 2), le nombre de succès dans la population (étape 3) et le nombre de réussites dans l'exemple (étape 4) comme indiqué ci-dessous.

P = K C k * (N - K) C (n - k) / N C n

Exemples de distribution hypergéométrique (avec modèle Excel)

Exemple 1

Prenons l'exemple d'un jeu de cartes ordinaire sous forme de cartes à jouer où 6 cartes sont tirées au hasard sans remplacement. Déterminez la probabilité de tirer exactement 4 cartes suites rouges, c'est-à-dire des diamants ou des cœurs.

  • Étant donné, N = 52 (puisqu'il y a 52 cartes dans un jeu de cartes ordinaire)
  • n = 6 (nombre de cartes tirées au hasard dans le jeu)
  • K = 26 (puisqu'il y a 13 cartes rouges chacune dans la suite de diamants et de coeurs)
  • k = 4 (nombre de cartons rouges à considérer comme réussis dans l'échantillon tiré)

Solution:

Par conséquent, la probabilité de tirer exactement 4 cartes suites rouges dans les 6 cartes tirées peut être calculée en utilisant la formule ci-dessus comme suit:

Probabilité = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C 4 * 26 C deux / 52 C 6

= 14950 * 325/20358520

La probabilité sera -

Probabilité = 0,2387 ~ 23,87%

Par conséquent, il y a une probabilité de 23,87% de tirer exactement 4 cartes rouges tout en tirant 6 cartes aléatoires d'un jeu ordinaire.

Exemple # 2

Prenons un autre exemple de portefeuille contenant 5 billets de 100 $ et 7 billets de 1 $. Si 4 billets sont choisis au hasard, déterminez la probabilité de choisir exactement 3 billets de 100 $.

  • Étant donné, N = 12 (nombre de billets de 100 $ + nombre de billets de 1 $)
  • n = 4 (Nombre de billets choisis au hasard)
  • K = 5 (puisqu'il y a 5 billets de 100 $)
  • k = 3 (nombre de billets de 100 $ à considérer comme un succès dans l'échantillon choisi)

Solution:

Par conséquent, la probabilité de choisir exactement 3 billets de 100 $ dans les 4 billets choisis au hasard peut être calculée en utilisant la formule ci-dessus comme suit:

Probabilité = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C une / douze C 4

= 10 * 7/495

La probabilité sera -

Probabilité = 0,1414 ~ 14,14%

Par conséquent, il y a une probabilité de 14,14% de choisir exactement 3 billets de 100 $ tout en tirant 4 billets au hasard.

Pertinence et utilisations

Le concept de distribution hypergéométrique est important car il fournit un moyen précis de déterminer les probabilités lorsque le nombre d'essais n'est pas un très grand nombre et que les échantillons sont prélevés sur une population finie sans remise. En fait, la distribution hypergéométrique est analogue à la distribution binomiale, qui est utilisée lorsque le nombre d'essais est substantiellement grand. Cependant, la distribution hypergéométrique est principalement utilisée pour l'échantillonnage sans remise.

Articles intéressants...