Test T (définition, types) - Exemples de calcul étape par étape

Table des matières

Qu'est-ce que T-Test?

Un test T est une méthode utilisée pour dériver une inférence en statistique, qui vise à savoir s'il existe une différence majeure entre deux moyens dans laquelle les deux groupes considérés peuvent être liés l'un à l'autre.

Explication

  • Il vise le test d'hypothèse, qui sert essentiellement à tester une hypothèse relative à une population donnée. Un test T considère la statistique T, les valeurs de distribution T et les degrés de liberté, qui sont utilisés pour déterminer la probabilité de différence entre deux ensembles de données.
  • Le travail de base derrière T-Test est qu'il considère un échantillon de chacun des deux ensembles et construit un énoncé de problème en considérant une hypothèse nulle où les deux moyennes sont déclarées égales.
  • Sur la base de formules assimilées, les valeurs sont tirées et comparées aux valeurs standard, ce qui conduit en outre à l'acceptation ou au rejet de l'hypothèse nulle. Le rejet de l'hypothèse nulle indique que l'ensemble de données est assez précis et non par hasard.

Types de test T

Il existe principalement quatre types de test t, qui sont les suivants:

# 1 - Test T à 1 échantillon

Il vise à tester si la moyenne de la valeur ciblée est égale à la moyenne d'une seule population, par exemple, tester si le poids moyen des élèves de la classe 5 est supérieur à 45 kg

# 2 - Test T à 2 échantillons

Il vise à tester si la moyenne de la valeur ciblée est égale à la moyenne de deux populations indépendantes, par exemple, tester si le poids moyen des garçons de la classe 5 est différent de celui des filles de la classe 5.

# 3 - Test T apparié

Il vise à tester si la moyenne de la valeur ciblée est égale à la moyenne des différences entre les observations dépendantes. Par exemple, la comparaison des notes des élèves avant et après la prise de cours pour chaque matière nous aide à déterminer si la prise de cours est suffisamment importante pour améliorer les notes des élèves.

# 4 - Test T dans la sortie de régression

Il prend en considération le coefficient dans l'équation de régression et teste dans quelle mesure il diffère de la valeur zéro. Par exemple, si la note à l'examen d'entrée est un facteur important pour déterminer si un étudiant obtiendra une bonne note finale.

Hypothèses du test T

  • La première hypothèse pour un test t est liée à l'échelle de mesure. Ceci est lié au fait que l'échelle suit une échelle continue ou ordinale
  • La deuxième hypothèse peut concerner la nature aléatoire de l'échantillon. Cela signifie que les données collectées doivent être de nature purement aléatoire.
  • La troisième hypothèse peut être que lorsque nous représentons les données relatives à la distribution du test t, elles devraient suivre une distribution normale et produire un graphique en forme de cloche.
  • La quatrième hypothèse peut être que pour la distribution t et spécifiquement pour obtenir une forme de la courbe en cloche, nous devons avoir une taille d'échantillon plus grande.
  • L'hypothèse finale peut être celle du test t. La variance doit être de nature homogène. e. les écarts types sont presque égaux.

Comment calculer?

Il fonctionne dans deux scénarios différents, c'est-à-dire un pour l'échantillon indépendant et un autre pour l'échantillon dépendant.

# 1 - Scénario d'échantillon indépendant

  • Nous devons calculer la somme, la taille de l'échantillon, qui est déterminée par «N», et la valeur du score pour la moyenne de chacun des échantillons indépendants. Après cela, le degré de liberté doit être calculé pour chaque échantillon indépendant.
  • Ceci est représenté en soustrayant l'échantillon par un, que nous désignons par «n-1». Après cela, la variance et l'écart type doivent être calculés.
  • Les degrés de liberté des échantillons sont ajoutés, et cela est appelé «df-total». Ensuite, nous devons multiplier le degré de liberté de chaque échantillon par la variance de chacun. Nous devons ajouter les résultantes, puis diviser le total par «df-total». Le résultat obtenu est appelé la variance groupée.
  • La variance groupée est ensuite divisée par le n des échantillons. Le résultat obtenu pour tous les échantillons est ensuite ajouté. La racine carrée de ceci est prise, et ceci est appelé l'erreur standard de la différence.
  • Enfin, nous devons soustraire la moyenne inférieure de l'échantillon de la moyenne supérieure de l'échantillon. La différence obtenue est ensuite divisée par l'erreur standard de la différence, et les résultats obtenus sont appelés la valeur T.

# 2 - Scénario d'échantillon dépendant

  • Les scores obtenus à partir de chacune des paires de jeux de données sont notés et nous devons les soustraire. Les différences obtenues sont ajoutées et désignées par «D.» Les différences de chaque échantillon sont mises au carré et ajoutées pour obtenir un résultat appelé «D-Squared». Après cela, nous devons multiplier le «N» ou le nombre de scores associés au «D-carré».
  • Le résultat obtenu est soustrait du carré du total «D». Ce résultat est ensuite divisé par «N-1». La racine carrée de la résultante est obtenue et est appelée un diviseur. Enfin, nous devons diviser le total «D» par le diviseur, ce qui nous donne la valeur t finale.

Exemples de test T

Considérons que nous avons des notes pour chaque matière à l'examen organisé pendant deux trimestres.

Étape 1: soustrayez la phase 1 de la phase 2

Étape 2: Additionnez toute la différence, c'est-à-dire -55

Étape 3: corrigez les différences

Étape 4: Additionnez tous les carrés de différence soit 983

Étape 5: Utilisation de la formule pour calculer la valeur T

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) deux / 6)) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • Valeur T = -2,29

La valeur T obtenue est ensuite comparée à la valeur T obtenue à partir du tableau en utilisant la valeur p et le degré de liberté. Si la valeur t calculée est supérieure à la valeur de la table à un niveau alpha prédéfini spécifique, nous pouvons rejeter l'hypothèse nulle indiquant qu'il y a une différence entre les moyennes.

Quand est-il utilisé?

Ceci est utilisé pour comparer deux moyennes ou proportions. De plus, nous utilisons un test t lorsque les paramètres de population sont inconnus de l'utilisateur. Il existe en gros trois cas d'utilisation de scénarios de test t, qui sont les suivants:

  • Un test t sur échantillon indépendant est utilisé lorsque nous voulons comparer la moyenne de deux groupes.
  • Un test t d'échantillons appariés est utilisé lorsque nous voulons comparer la moyenne du même groupe mais à des moments différents.
  • Un échantillon de test t est utilisé lorsque nous avons besoin de vérifier la moyenne d'un groupe individuel par rapport à une moyenne inconnue.

Utilisation du test T dans Excel

  • Dans Excel, la première chose dont nous avons besoin est l'installation d'un complément appelé Data Analysis. Après cela, nous devons aller dans "Données" sur l'onglet de menu et cliquer dessus. L'option «Analyse des données» y sera visible.
  • Pour effectuer un test T, nous devons avoir nos données dans un format en colonnes. En cliquant sur "Analyse des données", nous obtiendrons un certain nombre de tests statistiques que nous pouvons effectuer, et dans la liste, nous devons choisir un test t et cliquer sur "OK".
  • Une boîte de dialogue apparaît dans laquelle nous devons entrer les données pour le sentier 1 dans la zone de plage variable 1 et également les données d'essai 2 dans la plage de variables 2. Par défaut, la valeur alpha reste à 0,05, mais cela peut être modifié en fonction de nos préférences. Lorsque tout va bien, cliquez sur "OK".
  • Nous pouvons maintenant voir le résultat de notre test T sur la feuille Excel. La valeur la plus importante à noter ici est la valeur P. Sur ce que nous avons sélectionné notre valeur alpha, si notre valeur P dans Excel est inférieure à la valeur alpha, nous pouvons conclure qu'il existe une différence matérielle statistique entre les moyennes de nos deux ensembles de valeurs.

Conclusion

Le T-Test vise à tester des hypothèses, qui sont essentiellement utilisés pour tester une hypothèse se rapportant à une population donnée. Il nous indique le niveau de signification de la différence entre les groupes, qui sont généralement mesurés sur la base de la moyenne. Ici, nous trouvons essentiellement la différence entre les moyennes de population et une valeur hypothétique.

Articles intéressants...