1. Apprendre
  2. /
  3. Cours
  4. /
  5. Vérification d'hypothèses en Python

Connected

Exercice

Vérifier la taille de l'échantillon

Pour mener un test d'hypothèse et être certain que le résultat est valable, un échantillon doit respecter trois conditions : il s'agit d'un échantillon aléatoire de la population, les observations sont indépendantes et il y a suffisamment d'observations. Parmi celles-ci, seule la dernière condition est facile à vérifier par code.

La taille minimale de l'échantillon dépend du type de test d'hypothèse que vous voulez effectuer. Vous allez maintenant tester quelques scénarios sur l'ensemble de données late_shipments.

Notez que la méthode .all() de pandas peut servir à vérifier si tous les éléments sont vrais. Par exemple, pour un DataFrame df avec des valeurs numériques, vous pouvez vérifier si tous ses éléments sont inférieurs à 5 avec (df < 5).all().

late_shipments est disponible et pandas est importé sous pd.

Instructions 1/4

undefined XP
  • 1
    • Obtenez le nombre de chaque valeur dans la colonne freight_cost_group de late_shipments.
    • Insérez un nombre approprié pour vérifier si les effectifs sont « assez grands » pour un test t à deux échantillons.
  • 2
    • Obtenez le nombre de chaque valeur dans la colonne late de late_shipments.
    • Insérez un nombre approprié pour vérifier si les effectifs sont « assez grands » pour un test de proportion à un échantillon.
  • 3
    • Obtenez le nombre de chaque valeur dans la colonne freight_cost_group de late_shipments, groupées par vendor_inco_term.
    • Insérez un nombre approprié pour vérifier si les effectifs sont « assez grands » pour un test d'indépendance du khi carré.
  • 4
    • Obtenez le nombre de chaque valeur dans la colonne shipment_mode de late_shipments.
    • Insérez un nombre approprié pour vérifier si les effectifs sont « assez grands » pour un test ANOVA.