Imputazione con regressione lineare
A volte puoi usare la conoscenza del dominio, ricerche precedenti o semplicemente il buon senso per descrivere le relazioni tra le variabili nei tuoi dati. In questi casi, l’imputazione basata su modello è un’ottima soluzione, perché ti permette di imputare ogni variabile in base a un modello statistico che puoi specificare tu, tenendo conto di qualsiasi ipotesi su come le variabili si influenzano a vicenda.
Per le variabili continue, una scelta comune è la regressione lineare. Non ti limita però a relazioni solo lineari! Puoi sempre includere il quadrato o il logaritmo di una variabile tra i predittori. In questo esercizio userai il pacchetto simputation per eseguire una singola imputazione con regressione lineare sui dati tao e analizzare i risultati. Proviamoci!
Questo esercizio fa parte del corso
Gestione dei dati mancanti con imputazioni in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the simputation package
___
# Impute air_temp and humidity with linear regression
formula <- ____
tao_imp <- ___(tao, formula)