Spine plot
Il grafico di aggregazione che hai disegnato nell’esercizio precedente ti ha dato una panoramica ad alto livello dei dati mancanti. Se ti interessa l’interazione tra variabili specifiche, uno spine plot è la scelta giusta. Ti permette di studiare la percentuale di valori mancanti in una variabile al variare dei valori dell’altra, concettualmente molto simile ai t-test che hai eseguito nella lezione precedente.
In questo esercizio, disegnerai uno spine plot per analizzare la percentuale di dati mancanti in earnings per le diverse categorie di sub_race. Ci sono più dati mancanti sui guadagni per alcune razze specifiche del personaggio principale del film? Scopriamolo! Il pacchetto VIM è già stato caricato per te.
Questo esercizio fa parte del corso
Gestione dei dati mancanti con imputazioni in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Draw a spine plot to analyse missing values in earnings by sub_race
biopics %>%
select(___, ___) %>%
___()