IniziaInizia gratis

Valutare la qualità dell'imputazione con il margin plot

Nell'ultimo esercizio hai imputato la media di air_temp e aggiunto una variabile indicatrice per segnalare quali valori sono stati imputati, chiamata air_temp_imp. È il momento di vedere quanto funziona bene.

Esaminando i dati tao, potresti aver notato che contengono anche una variabile chiamata sea_surface_temp, che ragionevolmente ci aspettiamo sia positivamente correlata con air_temp. Se è così, ti aspetteresti che queste due temperature siano entrambe alte o entrambe basse nello stesso momento. Imputare la temperatura dell’aria con la media quando la temperatura del mare è alta o bassa romperebbe questa relazione.

Per verificarlo, in questo esercizio selezionerai le due variabili di temperatura e la variabile indicatrice e le userai per disegnare un margin plot. Valutiamo la mean imputation!

Questo esercizio fa parte del corso

Gestione dei dati mancanti con imputazioni in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>% 
  select(___, ___, ___) %>%
  ___(delimiter = ___)
Modifica ed esegui il codice