ComeçarComece de graça

Lidando com notas faltantes

Se quisermos usar as notas do SAT como nosso desfecho, precisamos avaliar a ausência de dados. Examine o padrão de valores ausentes em todas as variáveis de nyc_scores usando miss_var_summary() do pacote naniar. O naniar integra-se ao estilo de código do Tidyverse, incluindo o operador pipe (%>%).

Há 60 notas faltantes em cada disciplina. Embora existam muitos pacotes R que ajudam com formas mais avançadas de imputação, como MICE, Amelia e mi, vamos continuar usando simputation e impute_median().

Crie um novo conjunto de dados, nyc_scores_2, imputando a nota de Math por Borough, mas observe que impute_median() retorna a variável imputada com o tipo "impute". Você vai converter a variável para numérica em uma etapa separada.

simputation e dplyr já estão carregados.

Este exercício faz parte do curso

Planejamento de Experimentos em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load naniar
___

# Examine missingness with miss_var_summary()
___
Editar e executar o código