Taille de l'échantillon de test
Pour effectuer un test d'hypothèse et avoir la certitude que le résultat est juste, un échantillon doit répondre à trois exigences : il s'agit d'un échantillon aléatoire de la population, les observations sont indépendantes et le nombre d'observations est suffisant. Parmi ces conditions, seule la dernière est facilement testable avec du code.
La taille minimale de l'échantillon dépend du type de tests d'hypothèse que vous souhaitez effectuer. Vous allez maintenant tester quelques scénarios sur l'ensemble de données late_shipments
.
Notez que la méthode .all()
de pandas
peut être utilisée pour vérifier si tous les éléments sont vrais. Par exemple, étant donné un DataFrame df
avec des entrées numériques, vous vérifiez si tous ses éléments sont inférieurs à 5
, en utilisant (df < 5).all()
.
late_shipments
est disponible et pandas
est chargé en tant que pd
.
Cet exercice fait partie du cours
Tests d'hypothèses en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Count the freight_cost_group values
counts = ____
# Print the result
print(counts)
# Inspect whether the counts are big enough
print((counts >= ____).all())