Distribution d'échantillonnage - Définition, types et exemples

Qu'est-ce qu'une distribution d'échantillonnage?

Une distribution d'échantillonnage peut être définie comme une distribution de probabilité utilisant des statistiques en choisissant d'abord une population particulière, puis en utilisant des échantillons aléatoires qui sont tirés de la population, c'est-à-dire qu'elle vise essentiellement l'étalement des fréquences liées à la propagation de divers résultats ou des résultats qui peuvent éventuellement avoir lieu pour la population particulière choisie.

Explication

  • De nombreux chercheurs, académiciens, stratèges de marché, etc. préfèrent la distribution d'échantillons au lieu de choisir l'ensemble de la population. Cela rend l'ensemble de données facile et gérable. Pour faciliter les choses, supposons qu'un spécialiste du marketing veuille faire une analyse du nombre de jeunes à vélo entre deux régions dans la limite d'âge de 13 à 18 ans.
  • Pour cela, il ne prendra pas en compte l'ensemble de la population présente dans les deux régions entre 13 et 18 ans, ce qui n'est pratiquement pas possible, et même si cela est fait, cela prend trop de temps, et le jeu de données n'est pas gérable . Au lieu de cela, le spécialiste du marketing prélèvera un ensemble d'échantillons de 200 chacun de chaque région et effectuera la distribution.
  • Le décompte moyen de l'utilisation du vélo est appelé ici la moyenne de l'échantillon. Chaque échantillon choisi a sa propre moyenne générée, et la distribution effectuée pour la moyenne moyenne obtenue est définie comme la distribution de l'échantillon. L'écart obtenu est appelé erreur standard.

Exemple de distribution d'échantillonnage

  1. En supposant qu'un chercheur mène une étude sur le poids des habitants d'une ville particulière et qu'il dispose de cinq observations ou échantillons, soit 70 kg, 75 kg, 85 kg, 80 kg et 65 kg. La ville est généralement considérée comme ayant une distribution normale et maintient un écart type de 5 kg en ce qui concerne les mesures de poids. Ainsi, la moyenne peut être calculée comme suit (70 + 75 + 85 + 80 + 65) / 5 = 75 kg.
  2. De plus, nous supposons que la taille de la population est énorme; ainsi, pour passer à la deuxième étape, nous diviserons le nombre d'observations ou d'échantillons par 1, soit 1/5 = 0,20. Nous devons maintenant prendre la racine carrée de 0,20, ce qui revient à 0,45. La racine carrée est ensuite multipliée par l'écart type, soit 0,45 * 5 = 2,25 kg. Ainsi l'erreur standard obtenue est de 2,25 kg et la moyenne obtenue est de 75 kg. Ces deux facteurs peuvent être utilisés pour décrire la distribution.

Types de distribution d'échantillonnage

# 1 - Distribution d'échantillonnage de la moyenne

  • Cela peut être défini comme l'étalement probabiliste de toutes les moyennes d'échantillons choisis au hasard d'une taille fixe à partir d'une population particulière. Lorsque les échantillons ont choisi une population normale, l'étalement de la moyenne obtenue sera également normal à la moyenne et à l'écart type.
  • Si la population n'est pas normale à immobile, la distribution des moyennes aura tendance à se rapprocher de la distribution normale à condition que la taille de l'échantillon soit assez grande.

# 2 - Distribution d'échantillonnage de la proportion

Ceci est principalement associé aux statistiques impliquées dans les attributs. Ici, le rôle de la distribution binomiale entre en jeu. En général, il répond aux lois de la distribution binomiale, mais à mesure que la taille de l'échantillon augmente, il redevient généralement une distribution normale.

# 3 - Distribution en T de l'élève

Ce type de distribution est utilisé lorsque l'écart-type de la population est inconnu du chercheur ou lorsque la taille de l'échantillon est très petite. Ce type de distribution est très symétrique et remplit la condition de la variable normale standard. Au fur et à mesure que la taille de l'échantillon augmente, même la distribution T tend à devenir très proche de la distribution normale.

# 4 - Distribution F

  • Lorsque la plus grande variance est obligatoirement présente dans le numérateur, la distribution F trouve son utilisation lorsque le degré de liberté modifie également les valeurs critiques de F, ce qui est applicable à la fois aux grandes et aux petites variances. Cela peut être calculé à partir des tableaux disponibles.
  • La comparaison est faite à partir de la valeur mesurée de F appartenant à l'ensemble d'échantillons et de la valeur, qui est calculée à partir du tableau si la précédente est égale ou supérieure à la valeur du tableau, l'hypothèse nulle de l'étude est rejetée.

# 5 - Distribution de la formule du chi carré

Ce type de distribution est utilisé lorsque l'ensemble de données implique de traiter des valeurs qui incluent l'addition des carrés. L'ensemble des quantités au carré appartenant à la variance des échantillons est ajouté, et ainsi un étalement de distribution est fait, que nous appelons distribution du chi carré.

Importance

  • Ceci est important car cela simplifie le chemin vers l'inférence statistique. De plus, cela permet de concentrer les considérations analytiques sur une distribution statique plutôt que sur l'étalement probabiliste mixte de chaque unité d'échantillonnage choisie.
  • L'élimination de la variabilité présente dans la statistique se fait en utilisant cette distribution.
  • Il nous fournit une réponse sur les résultats probables qui sont les plus susceptibles de se produire.
  • Ils jouent un rôle clé dans les études statistiques inférentielles, ce qui signifie qu'ils jouent un rôle majeur dans les inférences concernant l'ensemble de la population.

Conclusion

  • Ceci est essentiel dans les statistiques car ils constituent une ligne directrice majeure pour l'inférence statistique. Ils guident essentiellement le chercheur, les académiciens ou les statisticiens sur la propagation des fréquences, signalant une gamme de résultats probables variés qui pourraient être davantage associés à l'ensemble de la population.
  • Le premier facteur impliqué ici est la moyenne de l'échantillon et l'erreur standard, qui, si elles sont estimées, nous aident également à calculer la distribution d'échantillonnage. Il existe différents types de techniques de distribution et, en fonction du scénario et de l'ensemble de données, chacune est appliquée.

Articles intéressants...