Inspeção de variáveis
Agora que adicionamos várias novas variáveis a abaloneMod, o próximo conjunto de exercícios vai explorar a qualidade dos dados usando estatísticas descritivas e visualização gráfica.
Você também vai filter() remover casos (linhas no conjunto de dados abaloneMod) que tenham erros ou valores ilógicos usando a função dplyr::filter(). Por exemplo, há algumas abalones com height igual a 0 mm, o que está incorreto por possíveis erros de digitação ou de medição.
O conjunto de dados abaloneMod já foi carregado para você, junto com os pacotes dplyr e ggplot2. Depois de filtrar os casos, você criará uma nova cópia modificada do conjunto de dados chamada abaloneKeep, que terá os casos finais mantidos para análise nas próximas lições.
Este exercício faz parte do curso
R para Usuários de SAS
Instruções do exercício
- Obtenha estatísticas descritivas para as alturas das abalones.
- Mantenha os casos com alturas maiores que 0 e atribua esses casos ao novo dataframe
abaloneKeep. - Para as abalones mantidas em
abaloneKeep, faça um histograma das alturas, que agora devem ser todas maiores que 0.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Pull height from abaloneMod and run summary()
___ %>%
___ %>%
___
# Keep cases with height > 0 assign to abaloneKeep
___ <- ___ %>%
___
# Make histogram of updated heights in abaloneKeep
ggplot(___) +
___