IniziaInizia gratis

Capire i rischi della imputazione con la media

Uno dei metodi di imputazione più diffusi è l’imputazione con la media, in cui i valori mancanti di una variabile vengono sostituiti con la media dei valori osservati di quella variabile. Tuttavia, in molti casi questo approccio semplice è una scelta poco adatta. A volte basta dare un’occhiata ai dati per intuire i rischi dell’imputazione con la media.

In questo capitolo lavorerai con un sottoinsieme dei dati del progetto Tropical Atmosphere Ocean (tao). L’insieme di dati è composto da misurazioni atmosferiche raccolte in due periodi diversi e in cinque località. I dati sono disponibili nel pacchetto VIM.

In questo esercizio prenderai confidenza con i dati ed eseguirai una semplice analisi per capire quali potrebbero essere le conseguenze dell’imputazione con la media. Diamo un’occhiata ai dati tao!

Questo esercizio fa parte del corso

Gestione dei dati mancanti con imputazioni in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Print first 10 observations
___(tao, ___)
Modifica ed esegui il codice