CommencerCommencer gratuitement

Taille de l'échantillon de test

Pour effectuer un test d'hypothèse et avoir la certitude que le résultat est juste, un échantillon doit répondre à trois exigences : il s'agit d'un échantillon aléatoire de la population, les observations sont indépendantes et le nombre d'observations est suffisant. Parmi ces conditions, seule la dernière est facilement testable avec du code.

La taille minimale de l'échantillon dépend du type de tests d'hypothèse que vous souhaitez effectuer. Vous allez maintenant tester quelques scénarios sur l'ensemble de données late_shipments.

Notez que la méthode .all() de pandas peut être utilisée pour vérifier si tous les éléments sont vrais. Par exemple, étant donné un DataFrame df avec des entrées numériques, vous vérifiez si tous ses éléments sont inférieurs à 5, en utilisant (df < 5).all().

late_shipments est disponible et pandas est chargé en tant que pd.

Cet exercice fait partie du cours

Tests d'hypothèses en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Count the freight_cost_group values
counts = ____

# Print the result
print(counts)

# Inspect whether the counts are big enough
print((counts >= ____).all())
Modifier et exécuter le code