Comprobar medidas de dimensión
Hasta ahora has eliminado 2 casos con alturas de abulón de 0 mm que se midieron incorrectamente. También eliminaste 4 casos en los que shuckedWeight era mayor que wholeWeight, lo cual es ilógico y probablemente se deba a errores de registro. El conjunto de datos abaloneKeep cargado para este ejercicio ahora tiene solo 4177 - 2 - 4 = 4171 casos.
Además, hay que revisar la relación entre las medidas dimensionales. La length de los abulones (en mm) se definió como la medida más larga de la concha. Por tanto, length siempre debe ser mayor que height o diameter. Ahora vas a comprobar esta condición usando un diagrama de dispersión con una línea de referencia Y=X. Después eliminarás cualquier caso que no cumpla esta condición de length.
El conjunto de datos abaloneKeep y los paquetes dplyr y ggplot2 también están cargados para ti.
Este ejercicio forma parte del curso
R para usuarios de SAS
Instrucciones del ejercicio
- Haz un diagrama de dispersión con
lengthen el eje x yheighten el eje y, y añade la línea de referencia Y=X con intercepto 0 y pendiente 1. - Haz un diagrama de dispersión con
lengthen el eje x ydiameteren el eje y, y añade la línea de referencia Y=X con intercepto 0 y pendiente 1. - Actualiza
abaloneKeeppara conservar los abulones conlengthmayor queheighty quediameter.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Make scatterplot of height by length add y=x line
ggplot(___) +
___ +
___
# Make scatterplot of diameter by length add y=x line
ggplot(___) +
___ +
___
# Keep abalones with length > both height and diameter
abaloneKeep <- abaloneKeep %>%
filter((___) & (___))