ComeçarComece de graça

Inspeção de variáveis

Agora que adicionamos várias novas variáveis a abaloneMod, o próximo conjunto de exercícios vai explorar a qualidade dos dados usando estatísticas descritivas e visualização gráfica.

Você também vai filter() remover casos (linhas no conjunto de dados abaloneMod) que tenham erros ou valores ilógicos usando a função dplyr::filter(). Por exemplo, há algumas abalones com height igual a 0 mm, o que está incorreto por possíveis erros de digitação ou de medição.

O conjunto de dados abaloneMod já foi carregado para você, junto com os pacotes dplyr e ggplot2. Depois de filtrar os casos, você criará uma nova cópia modificada do conjunto de dados chamada abaloneKeep, que terá os casos finais mantidos para análise nas próximas lições.

Este exercício faz parte do curso

R para Usuários de SAS

Ver curso

Instruções do exercício

  • Obtenha estatísticas descritivas para as alturas das abalones.
  • Mantenha os casos com alturas maiores que 0 e atribua esses casos ao novo dataframe abaloneKeep.
  • Para as abalones mantidas em abaloneKeep, faça um histograma das alturas, que agora devem ser todas maiores que 0.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Pull height from abaloneMod and run summary()
___ %>% 
  ___ %>%
  ___

# Keep cases with height > 0 assign to abaloneKeep
___ <- ___ %>%
  ___

# Make histogram of updated heights in abaloneKeep
ggplot(___) +
  ___
Editar e executar o código