CommencerCommencer gratuitement

Visualiser de nombreuses catégories

Jusqu’ici dans ce chapitre, nous n’avons considéré que les différences d’une variable numérique entre deux catégories. Bien sûr, de nombreux jeux de données en comportent davantage. Avant d’appliquer des tests à plusieurs catégories, il est souvent utile d’effectuer une analyse exploratoire des données : calculer des statistiques récapitulatives pour chaque groupe et visualiser les distributions de la variable numérique pour chaque catégorie à l’aide de boîtes à moustaches.

Ici, nous revenons aux données sur les livraisons en retard et à la façon dont le prix de chaque colis (pack_price) varie selon les trois modes d’expédition (shipment_mode) : "Air", "Air Charter" et "Ocean".

late_shipments est disponible ; dplyr et ggplot2 sont chargés.

Cet exercice fait partie du cours

Tests d’hypothèses en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Using late_shipments, group by shipment mode, and calculate the mean and std dev of pack price
___
Modifier et exécuter le code