IniziaInizia gratis

Box plot per outlier

Oltre a indicare centro e dispersione di una distribuzione, un box plot offre un modo grafico per individuare gli outlier. Puoi applicare questo metodo alla colonna msrp (manufacturer's suggested retail price) per verificare se ci sono auto insolitamente costose o economiche.

Questo esercizio fa parte del corso

Analisi esplorativa dei dati in R

Visualizza il corso

Istruzioni dell'esercizio

  • Costruisci un box plot di msrp.
  • Escludi i 3-5 outlier più grandi filtrando le righe per mantenere le auto con prezzo inferiore a $100,000. Salva questo insieme di dati ridotto come cars_no_out.
  • Costruisci un box plot analogo di msrp usando questo insieme di dati ridotto. Confronta i due grafici.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Construct box plot of msrp
cars %>%
  ggplot(aes(x = 1, y = ___)) +
  geom_boxplot()

# Exclude outliers from data
cars_no_out <- cars %>%
  filter(___)

# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
  ___ +
  ___
Modifica ed esegui il codice