ComeçarComece de graça

Identificar outliers

Considere a distribuição, mostrada aqui, das expectativas de vida dos países na Ásia. O box plot identifica um outlier claro: um país com expectativa de vida notavelmente baixa. Você tem um palpite de qual país pode ser? Teste seu palpite no console usando min() ou filter(), depois avance para construir um gráfico com esse país removido.

Este exercício faz parte do curso

Análise Exploratória de Dados em R

Ver curso

Instruções do exercício

gap2007 ainda está disponível no seu workspace.

  • Aplique um filtro para conter apenas observações da Ásia e, em seguida, crie uma nova variável chamada is_outlier que seja TRUE para países com expectativa de vida menor que 50. Atribua o resultado a gap_asia.
  • Filtre gap_asia para remover todos os outliers e, depois, crie outro box plot das expectativas de vida restantes.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Filter for Asia, add column indicating outliers
gap_asia <- ___ %>%
  filter(___) %>%
  mutate(___ = ___)

# Remove outliers, create box plot of lifeExp
gap_asia %>%
  filter(___) %>%
  ggplot(aes(x = ___, y = ___)) +
  ___
Editar e executar o código