ComeçarComece de graça

Erros de imputação por variável

No exercício anterior, você extraiu os erros de imputação estimados a partir da saída do missForest. Isso te deu dois números:

  • o erro quadrático médio da raiz normalizado (NRMSE) para todas as variáveis contínuas;
  • a proporção de classificações incorretas (PFC) para todas as variáveis categóricas.

No entanto, pode muito bem ser que o modelo de imputação funcione muito bem para uma variável contínua e mal para outra! Para diagnosticar esses casos, basta dizer ao missForest para produzir estimativas de erro por variável. Isso é feito definindo o argumento variablewise como TRUE.

Os dados biopics e o pacote missForest já foram carregados para você, então vamos dar uma olhada mais de perto nos erros!

Este exercício faz parte do curso

Tratamento de Dados Ausentes com Imputações em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)
Editar e executar o código