Statistique du test de la moyenne à deux échantillons

Le test d'hypothèse visant à déterminer s'il existe une différence entre les moyennes de deux populations utilise un type de statistique de test différent des scores z que vous avez vus au chapitre 1. Il s'appelle « t » et peut être calculé à partir de trois valeurs de chaque échantillon à l'aide de l'équation suivante.

$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$

En essayant de déterminer la raison pour laquelle certains envois sont en retard, vous pouvez vous demander si le poids des envois qui étaient à l'heure est inférieur au poids des envois qui étaient en retard. L'ensemble de données late_shipments a été divisé en un groupe « oui » (late == "Yes") et un groupe « non » (late == "No"). Le poids de l'envoi est indiqué dans la variable weight_kilograms.

Les moyennes de l'échantillon pour les deux groupes sont disponibles sous xbar_no et xbar_yes. Les écarts types de l'échantillon sont s_no et s_yes. Les tailles d'échantillon sont n_no et n_yes. numpy est également chargé en tant que np.

Cet exercice fait partie du cours

Tests d'hypothèses en Python

Afficher le cours

Instructions

Calculez le numérateur de la statistique du test $t$.
Calculez le dénominateur de la statistique du test $t$.
Utilisez ces deux nombres pour calculer la statistique du test $t$.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the numerator of the test statistic
numerator = ____

# Calculate the denominator of the test statistic
denominator = ____

# Calculate the test statistic
t_stat = ____

# Print the test statistic
print(t_stat)

Modifier et exécuter le code