Box plot per outlier
Oltre a indicare centro e dispersione di una distribuzione, un box plot
offre un modo grafico per individuare gli outlier. Puoi applicare questo metodo alla
colonna msrp (manufacturer's suggested retail price) per verificare se ci sono auto insolitamente
costose o economiche.
Questo esercizio fa parte del corso
Analisi esplorativa dei dati in R
Istruzioni dell'esercizio
- Costruisci un box plot di
msrp. - Escludi i 3-5 outlier più grandi filtrando le righe per mantenere le auto con prezzo inferiore a $100,000. Salva questo insieme di dati ridotto come
cars_no_out. - Costruisci un box plot analogo di
msrpusando questo insieme di dati ridotto. Confronta i due grafici.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Construct box plot of msrp
cars %>%
ggplot(aes(x = 1, y = ___)) +
geom_boxplot()
# Exclude outliers from data
cars_no_out <- cars %>%
filter(___)
# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
___ +
___