Errori di imputazione per variabile
Nel precedente esercizio hai estratto gli errori di imputazione stimati dall'output di missForest. Questo ti ha dato due numeri:
- la normalized root mean squared error (NRMSE) per tutte le variabili continue;
- la proportion of falsely classified entries (PFC) per tutte le variabili categoriali.
Tuttavia, può darsi che il modello di imputazione funzioni benissimo per una variabile continua e male per un'altra! Per diagnosticare questi casi, basta chiedere a missForest di produrre stime d'errore per variabile. Si fa impostando l'argomento variablewise a TRUE.
I dati biopics e il pacchetto missForest sono già stati caricati per te, quindi diamo un'occhiata più da vicino agli errori!
Questo esercizio fa parte del corso
Gestione dei dati mancanti con imputazioni in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)