Identificar outliers
Considere a distribuição, mostrada aqui, das expectativas de vida dos países na Ásia. O box plot identifica um outlier claro: um país com expectativa de vida notavelmente baixa. Você tem um palpite de qual país pode ser? Teste seu palpite no console usando min() ou filter(), depois avance para construir um gráfico com esse país removido.
Este exercício faz parte do curso
Análise Exploratória de Dados em R
Instruções do exercício
gap2007 ainda está disponível no seu workspace.
- Aplique um filtro para conter apenas observações da Ásia e, em seguida, crie uma nova variável chamada
is_outlierque sejaTRUEpara países com expectativa de vida menor que 50. Atribua o resultado agap_asia. - Filtre
gap_asiapara remover todos os outliers e, depois, crie outro box plot das expectativas de vida restantes.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Filter for Asia, add column indicating outliers
gap_asia <- ___ %>%
filter(___) %>%
mutate(___ = ___)
# Remove outliers, create box plot of lifeExp
gap_asia %>%
filter(___) %>%
ggplot(aes(x = ___, y = ___)) +
___