IniziaInizia gratis

Imputazione con regressione lineare

A volte puoi usare la conoscenza del dominio, ricerche precedenti o semplicemente il buon senso per descrivere le relazioni tra le variabili nei tuoi dati. In questi casi, l’imputazione basata su modello è un’ottima soluzione, perché ti permette di imputare ogni variabile in base a un modello statistico che puoi specificare tu, tenendo conto di qualsiasi ipotesi su come le variabili si influenzano a vicenda.

Per le variabili continue, una scelta comune è la regressione lineare. Non ti limita però a relazioni solo lineari! Puoi sempre includere il quadrato o il logaritmo di una variabile tra i predittori. In questo esercizio userai il pacchetto simputation per eseguire una singola imputazione con regressione lineare sui dati tao e analizzare i risultati. Proviamoci!

Questo esercizio fa parte del corso

Gestione dei dati mancanti con imputazioni in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the simputation package
___

# Impute air_temp and humidity with linear regression
formula <- ____
tao_imp <- ___(tao, formula)
Modifica ed esegui il codice