Taille de l'échantillon (définition, formule) - Calculer la taille de l'échantillon

Formule pour déterminer la taille de l'échantillon de la population

La formule de taille de l'échantillon aide à calculer ou à déterminer la taille minimale de l'échantillon qui est nécessaire pour connaître la proportion adéquate ou correcte de la population ainsi que le niveau de confiance et la marge d'erreur.

Le terme «échantillon» fait référence à la partie de la population qui nous permet de tirer des inférences sur la population et il est donc important que la taille de l'échantillon soit suffisamment adéquate pour que des inférences significatives puissent être faites. En d'autres termes, c'est la taille minimale qui est nécessaire pour estimer la vraie proportion de population avec la marge d'erreur et le niveau de confiance requis. En tant que tel, la détermination de la taille appropriée de l'échantillon est l'un des problèmes récurrents de l'analyse statistique. Son équation peut être dérivée en utilisant la taille de la population, la valeur critique de la distribution normale, la proportion de l'échantillon et la marge d'erreur.

Taille de l'échantillon n = N * (Z 2 * p * (1-p) / e 2 ) / (N - 1 + (Z 2 * p * (1-p) / e 2 )

où,

  • N = taille de la population,
  • Z = valeur critique de la distribution normale au niveau de confiance requis,
  • p = proportion de l'échantillon,
  • e = marge d'erreur

Comment calculer la taille de l'échantillon? (Pas à pas)

  • Étape 1: Tout d'abord, déterminez la taille de la population, qui est le nombre total d'entités distinctes dans votre population, et elle est indiquée par N. (Remarque: si la taille de la population est très grande mais que le nombre exact n'est pas connu, utilisez 100000 parce que la taille de l'échantillon ne change pas beaucoup pour les populations plus grandes que cela.)
  • Étape 2: Ensuite, déterminez la valeur critique de la distribution normale au niveau de confiance requis. Par exemple, la valeur critique à un niveau de confiance de 95% est 1,96.
  • Étape 3: Ensuite, déterminez la proportion de l'échantillon qui peut être utilisée à partir des résultats de l'enquête précédente ou être collectée en exécutant une petite enquête pilote. (Remarque: en cas de doute, on peut toujours utiliser 0,5 comme approche prudente, et cela donnera la plus grande taille d'échantillon possible.)
  • Étape 4: Ensuite, déterminez la marge d'erreur, qui est la plage dans laquelle la population réelle devrait se trouver. (Remarque: plus la marge d'erreur est petite, plus la précision est élevée et donc la réponse exacte.)
  • Étape 5: Enfin, l'équation de la taille de l'échantillon peut être dérivée en utilisant la taille de la population (étape 1), la valeur critique de la distribution normale au niveau de confiance requis (étape 2), la proportion de l'échantillon (étape 3) et la marge d'erreur ( étape 4) comme indiqué ci-dessous.

Exemples

Exemple 1

Prenons l'exemple d'un détaillant qui souhaite savoir combien de ses clients lui ont acheté un article après avoir consulté son site Web un certain jour. Étant donné que leur site Web enregistre en moyenne, 10000 vues par jour déterminent la taille de l'échantillon des clients qu'ils doivent surveiller à un niveau de confiance de 95% avec une marge d'erreur de 5% si:

  • Ils ne sont pas certains du taux de conversion actuel.
  • Ils savent d'après les enquêtes précédentes que le taux de conversion est de 5%.

Donné,

  • Taille de la population, N = 10 000
  • Valeur critique à un niveau de confiance de 95%, Z = 1,96
  • Marge d'erreur, e = 5% ou 0,05

1 - Le taux de conversion actuel étant inconnu, supposons p = 0,5

Par conséquent, la taille de l'échantillon peut être calculée à l'aide de la formule suivante:

= (10 000 * (1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ) / (10 000 - 1 + ((1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ))))

Par conséquent, 370 clients suffiront pour en déduire une conclusion significative.

2 - Le taux de conversion actuel est p = 5% ou 0,05

Par conséquent, la taille de l'échantillon peut être calculée à l'aide de la formule ci-dessus comme suit:

= (10 000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (10 000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Par conséquent, une taille de 72 clients sera adéquate pour en tirer une inférence significative dans ce cas.

Exemple # 2

Prenons l'exemple ci-dessus, et dans ce cas, supposons que la taille de la population, c'est-à-dire la consultation quotidienne du site Web, est comprise entre 100 000 et 120 000, mais alors la valeur exacte n'est pas connue. Les autres valeurs sont identiques, avec un taux de conversion de 5%. Calculez la taille de l'échantillon pour 100 000 et 120 000.

Donné,

  • Proportion d'échantillon, p = 0,05
  • Valeur critique à un niveau de confiance de 95%, Z = 1,96
  • Marge d'erreur, e = 0,05

Par conséquent, la taille de l'échantillon pour N = 100 000 peut être calculée comme suit:

= (100000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (100000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Par conséquent, la taille de l'échantillon pour N = 120 000 peut être calculée comme suit:

= (120000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (120000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Par conséquent, il est prouvé que, à mesure que la taille de la population augmente pour devenir très grande, elle devient sans importance dans le calcul de la taille de l'échantillon.

Pertinence et utilisations

Le calcul de la taille de l'échantillon est important pour comprendre le concept de la taille appropriée de l'échantillon, car il est utilisé pour la validité des résultats de la recherche. Dans le cas où il est trop petit, il ne donnera pas de résultats valides, tandis qu'un échantillon est trop grand peut être une perte de temps et d'argent. Statistiquement, la taille significative de l'échantillon est principalement utilisée pour les études de marché, les enquêtes sur la santé et les enquêtes sur l'éducation.

Articles intéressants...