Erros de imputação por variável
No exercício anterior, você extraiu os erros de imputação estimados a partir da saída do missForest. Isso te deu dois números:
- o erro quadrático médio da raiz normalizado (NRMSE) para todas as variáveis contínuas;
- a proporção de classificações incorretas (PFC) para todas as variáveis categóricas.
No entanto, pode muito bem ser que o modelo de imputação funcione muito bem para uma variável contínua e mal para outra! Para diagnosticar esses casos, basta dizer ao missForest para produzir estimativas de erro por variável. Isso é feito definindo o argumento variablewise como TRUE.
Os dados biopics e o pacote missForest já foram carregados para você, então vamos dar uma olhada mais de perto nos erros!
Este exercício faz parte do curso
Tratamento de Dados Ausentes com Imputações em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)