Uso della matrice dei predittori
Una decisione importante quando si usa l’imputazione basata su modello è stabilire quali variabili includere come predittori e in quali modelli. In mice(), questo è controllato dalla matrice dei predittori e, per impostazione predefinita, tutte le variabili vengono usate per imputare tutte le altre.
Nel caso di molti campi nell’insieme di dati o di poco tempo per fare una corretta selezione del modello, puoi usare la funzionalità di mice per creare una matrice dei predittori basata sulle correlazioni tra le variabili. Questa matrice può poi essere passata a mice(). In questo esercizio, farai proprio questo: prima costruirai una matrice dei predittori in modo che ogni variabile venga imputata usando le variabili più correlate; poi passerai la tua matrice dei predittori alla funzione di imputazione. Proviamo questa semplice selezione del modello!
Questo esercizio fa parte del corso
Gestione dei dati mancanti con imputazioni in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create predictor matrix with minimum correlation of 0.1
pred_mat <- ___(biopics, mincor = ___)