ComeçarComece de graça

Verificar medidas dimensionais

Até aqui, você removeu 2 casos com altura de abalone igual a 0 mm, que foram medidos incorretamente. Você também removeu 4 casos em que shuckedWeight era maior que wholeWeight, o que é ilógico e provavelmente ocorreu por erros de registro. O conjunto abaloneKeep carregado para este exercício agora tem apenas 4177 - 2 - 4 = 4171 casos.

Além disso, é preciso revisar a relação entre as medidas dimensionais. O length dos abalones (em mm) foi definido como a maior medida da concha. Portanto, length deve ser sempre maior que height ou diameter. Agora, você vai verificar essa condição usando um gráfico de dispersão com uma linha de referência Y=X. Em seguida, você vai remover quaisquer casos que não atendam a essa condição de length.

O conjunto abaloneKeep e os pacotes dplyr e ggplot2 também já estão carregados para você.

Este exercício faz parte do curso

R para Usuários de SAS

Ver curso

Instruções do exercício

  • Faça um gráfico de dispersão com length no eixo x e height no eixo y e adicione a linha de referência Y=X com intercepto 0 e inclinação 1.
  • Faça um gráfico de dispersão com length no eixo x e diameter no eixo y e adicione a linha de referência Y=X com intercepto 0 e inclinação 1.
  • Atualize abaloneKeep para manter os abalones com length maior do que tanto height quanto diameter.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Make scatterplot of height by length add y=x line
ggplot(___) +
  ___ + 
  ___

# Make scatterplot of diameter by length add y=x line
ggplot(___) +
  ___ + 
  ___

# Keep abalones with length > both height and diameter
abaloneKeep <- abaloneKeep %>%
  filter((___) & (___))
Editar e executar o código