Statistique de test pour deux moyennes

Le test d'hypothèse visant à déterminer s'il existe une différence entre les moyennes de deux populations utilise un type de statistique de test différent des z-scores vus au chapitre 1. Il s'agit de « t », qui peut être calculée à partir de trois valeurs pour chaque échantillon selon l'équation suivante.

$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$

En cherchant à comprendre pourquoi certaines expéditions arrivent en retard, vous pouvez vous demander si le poids des envois en retard diffère de celui des envois arrivés à l'heure. Le jeu de données late_shipments a été scindé en un groupe « yes », où late == "Yes", et un groupe « no », où late == "No". Le poids de l'envoi est indiqué dans la variable weight_kilograms.

Pour vous faciliter la tâche, les moyennes d'échantillon des deux groupes sont disponibles sous xbar_no et xbar_yes. Les écarts types d'échantillon sont s_no et s_yes. Les tailles d'échantillon sont n_no et n_yes.

Cet exercice fait partie du cours

Tests d’hypothèses en R

Afficher le cours

Instructions

Calculez le numérateur de la statistique de test.
Calculez le dénominateur de la statistique de test.
Utilisez ces deux valeurs pour calculer la statistique de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the numerator of the test statistic
numerator <- ___

# Calculate the denominator of the test statistic
denominator <- ___

# Calculate the test statistic
t_stat <- ___

# See the result
t_stat

Modifier et exécuter le code