1. Apprendre
  2. /
  3. Cours
  4. /
  5. Vérification d'hypothèses en Python

Connected

Exercice

Statistique de test pour deux moyennes

Le test d'hypothèse pour déterminer s'il existe une différence entre les moyennes de deux populations utilise un type de statistique de test différent des scores z que vous avez vus au chapitre 1. On l'appelle « t », et on peut le calculer à partir de trois valeurs pour chaque échantillon à l'aide de cette équation.

$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$

En tentant de comprendre pourquoi certains envois arrivent en retard, vous pourriez vous demander si le poids des envois arrivés à temps est inférieur à celui des envois en retard. Le jeu de données late_shipments a été séparé en un groupe « yes », où late == "Yes", et un groupe « no » où late == "No". Le poids de l'envoi se trouve dans la variable weight_kilograms.

Les moyennes d'échantillon des deux groupes sont disponibles sous xbar_no et xbar_yes. Les écarts types d'échantillon sont s_no et s_yes. Les tailles d'échantillon sont n_no et n_yes. numpy est aussi chargé sous np.

Instructions

100 XP
  • Calculez le numérateur de la statistique de test \(t\).
  • Calculez le dénominateur de la statistique de test \(t\).
  • Utilisez ces deux nombres pour calculer la statistique de test \(t\).