ComenzarEmpieza gratis

Comprobar el conjunto de datos final

A estas alturas has añadido seis variables nuevas al conjunto de datos original abalone, aumentando el número de columnas de 9 a 15. También has filtrado (2+4+2) = 8 casos con distintos errores de medida o de registro, quedando 4169 casos.

En este ejercicio vas a verificar estos números ejecutando dim() para comprobar las dimensiones del conjunto de datos final abaloneKeep. También harás algunas comprobaciones sobre este conjunto final revisando las estadísticas descriptivas de todas las variables y creando algunos diagramas de dispersión más para volver a comprobar las suposiciones sobre pesos y dimensiones.

El conjunto de datos abaloneKeep y los paquetes dplyr y ggplot2 ya están cargados.

Este ejercicio forma parte del curso

R para usuarios de SAS

Ver curso

Instrucciones del ejercicio

  • Obtén las dimensiones del conjunto de datos final abaloneKeep.
  • Obtén las estadísticas descriptivas de todas las variables en abaloneKeep.
  • Crea un diagrama de dispersión con wholeWeight en el eje x y shuckedWeight en el eje y; añade una línea de referencia con intercepto 0 y pendiente 1.
  • Crea un diagrama de dispersión con diameter en el eje x y length en el eje y; añade una línea de referencia con intercepto 0 y pendiente 1.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Dimensions of final dataset with samples in abaloneKeep
___

# Get summary statistics of all variables in abaloneKeep
___

# Scatterplot of shuckedWeight by wholeWeight add y=x line
ggplot(___) +
  ___ +
  ___

# Scatterplot of length by diameter add y=x line
ggplot(___) +
  ___ +
  ___
Editar y ejecutar código