Lidando com notas faltantes
Se quisermos usar as notas do SAT como nosso desfecho, precisamos avaliar a ausência de dados. Examine o padrão de valores ausentes em todas as variáveis de nyc_scores usando miss_var_summary() do pacote naniar. O naniar integra-se ao estilo de código do Tidyverse, incluindo o operador pipe (%>%).
Há 60 notas faltantes em cada disciplina. Embora existam muitos pacotes R que ajudam com formas mais avançadas de imputação, como MICE, Amelia e mi, vamos continuar usando simputation e impute_median().
Crie um novo conjunto de dados, nyc_scores_2, imputando a nota de Math por Borough, mas observe que impute_median() retorna a variável imputada com o tipo "impute". Você vai converter a variável para numérica em uma etapa separada.
simputation e dplyr já estão carregados.
Este exercício faz parte do curso
Planejamento de Experimentos em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load naniar
___
# Examine missingness with miss_var_summary()
___