IniziaInizia gratis

Errori di imputazione per variabile

Nel precedente esercizio hai estratto gli errori di imputazione stimati dall'output di missForest. Questo ti ha dato due numeri:

  • la normalized root mean squared error (NRMSE) per tutte le variabili continue;
  • la proportion of falsely classified entries (PFC) per tutte le variabili categoriali.

Tuttavia, può darsi che il modello di imputazione funzioni benissimo per una variabile continua e male per un'altra! Per diagnosticare questi casi, basta chiedere a missForest di produrre stime d'errore per variabile. Si fa impostando l'argomento variablewise a TRUE.

I dati biopics e il pacchetto missForest sono già stati caricati per te, quindi diamo un'occhiata più da vicino agli errori!

Questo esercizio fa parte del corso

Gestione dei dati mancanti con imputazioni in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)
Modifica ed esegui il codice