Verificar medidas dimensionais
Até aqui, você removeu 2 casos com altura de abalone igual a 0 mm, que foram medidos incorretamente. Você também removeu 4 casos em que shuckedWeight era maior que wholeWeight, o que é ilógico e provavelmente ocorreu por erros de registro. O conjunto abaloneKeep carregado para este exercício agora tem apenas 4177 - 2 - 4 = 4171 casos.
Além disso, é preciso revisar a relação entre as medidas dimensionais. O length dos abalones (em mm) foi definido como a maior medida da concha. Portanto, length deve ser sempre maior que height ou diameter. Agora, você vai verificar essa condição usando um gráfico de dispersão com uma linha de referência Y=X. Em seguida, você vai remover quaisquer casos que não atendam a essa condição de length.
O conjunto abaloneKeep e os pacotes dplyr e ggplot2 também já estão carregados para você.
Este exercício faz parte do curso
R para Usuários de SAS
Instruções do exercício
- Faça um gráfico de dispersão com
lengthno eixo x eheightno eixo y e adicione a linha de referência Y=X com intercepto 0 e inclinação 1. - Faça um gráfico de dispersão com
lengthno eixo x ediameterno eixo y e adicione a linha de referência Y=X com intercepto 0 e inclinação 1. - Atualize
abaloneKeeppara manter os abalones comlengthmaior do que tantoheightquantodiameter.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Make scatterplot of height by length add y=x line
ggplot(___) +
___ +
___
# Make scatterplot of diameter by length add y=x line
ggplot(___) +
___ +
___
# Keep abalones with length > both height and diameter
abaloneKeep <- abaloneKeep %>%
filter((___) & (___))