Usando a matriz de preditores
Uma decisão importante ao usar imputação baseada em modelo é quais variáveis incluir como preditoras e em quais modelos. No mice(), isso é controlado pela matriz de preditores e, por padrão, todas as variáveis são usadas para imputar todas as outras.
Quando há muitas variáveis no conjunto de dados ou pouco tempo para fazer uma seleção de modelo adequada, você pode usar a funcionalidade do mice para criar uma matriz de preditores com base nas correlações entre as variáveis. Essa matriz pode então ser passada para o mice(). Neste exercício, você vai praticar exatamente isso: primeiro, vai construir uma matriz de preditores de modo que cada variável seja imputada usando as variáveis mais correlacionadas a ela; depois, vai passar sua matriz de preditores para a função de imputação. Vamos testar essa seleção simples de modelos!
Este exercício faz parte do curso
Tratamento de Dados Ausentes com Imputações em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create predictor matrix with minimum correlation of 0.1
pred_mat <- ___(biopics, mincor = ___)