1. Apprendre
  2. /
  3. Cours
  4. /
  5. Vérification d'hypothèses en Python

Connected

Exercice

Visualiser de nombreuses catégories

Jusqu'ici dans ce chapitre, nous avons seulement examiné les différences d'une variable numérique entre deux catégories. Bien entendu, plusieurs jeux de données comportent plus de deux catégories. Avant de faire des tests sur plusieurs catégories, il est souvent utile de réaliser une analyse exploratoire des données (AED) : calculez des statistiques sommaires pour chaque groupe et visualisez la distribution de la variable numérique pour chaque catégorie à l'aide de diagrammes en boîtes (boxplots).

Ici, nous revenons aux données sur les envois en retard et à la façon dont le prix de chaque colis (pack_price) varie entre les trois modes d'expédition (shipment_mode) : "Air", "Air Charter" et "Ocean".

late_shipments est disponible ; pandas et matplotlib.pyplot sont chargés avec leurs alias standards, et seaborn est chargé en tant que sns.

Instructions 1/3

undefined XP
    1
    2
    3
  • Regroupez late_shipments par shipment_mode et calculez la moyenne de pack_price pour chaque groupe, en stockant le résultat dans xbar_pack_by_mode.