IniziaInizia gratis

Uso della matrice dei predittori

Una decisione importante quando si usa l’imputazione basata su modello è stabilire quali variabili includere come predittori e in quali modelli. In mice(), questo è controllato dalla matrice dei predittori e, per impostazione predefinita, tutte le variabili vengono usate per imputare tutte le altre.

Nel caso di molti campi nell’insieme di dati o di poco tempo per fare una corretta selezione del modello, puoi usare la funzionalità di mice per creare una matrice dei predittori basata sulle correlazioni tra le variabili. Questa matrice può poi essere passata a mice(). In questo esercizio, farai proprio questo: prima costruirai una matrice dei predittori in modo che ogni variabile venga imputata usando le variabili più correlate; poi passerai la tua matrice dei predittori alla funzione di imputazione. Proviamo questa semplice selezione del modello!

Questo esercizio fa parte del corso

Gestione dei dati mancanti con imputazioni in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create predictor matrix with minimum correlation of 0.1
pred_mat <- ___(biopics, mincor = ___)
Modifica ed esegui il codice