IniziaInizia gratis

Visualizzare molte categorie

Finora in questo capitolo abbiamo considerato solo il caso delle differenze in una variabile numerica tra due categorie. Naturalmente, molti insiemi di dati contengono più categorie. Prima di eseguire test su molte categorie, è spesso utile fare un'analisi esplorativa dei dati: calcolare statistiche riassuntive per ogni gruppo e visualizzare le distribuzioni della variabile numerica per ciascuna categoria usando box plot.

Qui torniamo ai dati sulle spedizioni in ritardo e osserviamo come il prezzo di ogni pacco (pack_price) varia tra le tre modalità di spedizione (shipment_mode): "Air", "Air Charter" e "Ocean".

late_shipments è disponibile; dplyr e ggplot2 sono caricati.

Questo esercizio fa parte del corso

Test di ipotesi in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Using late_shipments, group by shipment mode, and calculate the mean and std dev of pack price
___
Modifica ed esegui il codice