Identificar exceções
Considere a distribuição, mostrada aqui, das expectativas de vida dos países da Ásia. O gráfico de caixa identifica uma exceção clara: um país com uma expectativa de vida notavelmente baixa. Você tem um palpite de qual país seria esse? Teste sua suposição no console usando min()
ou filter()
e, em seguida, prossiga com a construção de um gráfico com esse país removido.
Este exercício faz parte do curso
Análise exploratória de dados em R
Instruções do exercício
gap2007
ainda está disponível em seu espaço de trabalho.
- Aplique um filtro para que ele contenha apenas observações da Ásia e, em seguida, crie uma nova variável chamada
is_outlier
, que éTRUE
para países com expectativa de vida inferior a 50. Atribua o resultado agap_asia
. - Filtre
gap_asia
para remover todos os valores discrepantes e, em seguida, crie outro gráfico de caixa das expectativas de vida restantes.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Filter for Asia, add column indicating outliers
gap_asia <- ___ %>%
filter(___) %>%
mutate(___ = ___)
# Remove outliers, create box plot of lifeExp
gap_asia %>%
filter(___) %>%
ggplot(aes(x = ___, y = ___)) +
___