Scelta dei modelli predefiniti
MICE crea un modello di imputazione separato per ciascuna variabile nei dati. Il tipo di modello dipende dal tipo della variabile considerata. Un modo comune per specificare i tipi di modelli da usare è impostare un modello predefinito per ciascuno dei quattro tipi di variabile.
Puoi farlo passando l'argomento defaultMethod a mice(), che deve essere un vettore di lunghezza 4 contenente i metodi di imputazione predefiniti per:
- Variabili continue,
- Variabili binarie,
- Variabili categoriche (fattori non ordinati),
- Variabili fattoriali (fattori ordinati).
In questo esercizio, sfrutterai la documentazione di mice per visualizzare l'elenco dei metodi disponibili e scegliere quelli desiderati da usare nell'algoritmo. Facciamo un po' di model selection!
Questo esercizio fa parte del corso
Gestione dei dati mancanti con imputazioni in R
Istruzioni dell'esercizio
- Nell'RDocumentation restituita da
?mice, c'è una tabella che contiene la parola chiave per ciascun metodo. - Imputa i dati
biopicsconmice()usando i seguenti metodi predefiniti, in questo ordine: classification and regression trees, linear discriminant analysis, predictive mean matching, proportional odds model. - Stampa
biopics_multiimpper vedere quale metodo è stato usato per ciascuna variabile.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Impute biopics using the methods specified in the instruction
biopics_multiimp <- ___(biopics, m = 20,
defaultMethod = ___)
# Print biopics_multiimp
print(biopics_multiimp)