Escolhendo modelos padrão
O MICE cria um modelo de imputação separado para cada variável dos dados. O tipo de modelo depende do tipo de variável em questão. Uma forma popular de especificar os tipos de modelos que queremos usar é definir um modelo padrão para cada um dos quatro tipos de variáveis.
Você pode fazer isso passando o argumento defaultMethod para mice(), que deve ser um vetor de comprimento 4 contendo os métodos de imputação padrão para:
- Variáveis contínuas,
- Variáveis binárias,
- Variáveis categóricas (fatores não ordenados),
- Variáveis fator (fatores ordenados).
Neste exercício, você vai aproveitar a documentação do mice para ver a lista de métodos disponíveis e escolher aqueles que o algoritmo deve usar. Vamos fazer uma seleção de modelos!
Este exercício faz parte do curso
Tratamento de Dados Ausentes com Imputações em R
Instruções do exercício
- Na RDocumentation retornada por
?mice, há uma tabela contendo a palavra-chave de cada método. - Impute os dados
biopicscommice()usando os seguintes métodos padrão, nesta ordem: árvores de classificação e regressão, análise discriminante linear, predictive mean matching, modelo de chances proporcionais. - Imprima
biopics_multiimppara ver qual método foi usado para cada variável.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Impute biopics using the methods specified in the instruction
biopics_multiimp <- ___(biopics, m = 20,
defaultMethod = ___)
# Print biopics_multiimp
print(biopics_multiimp)