ComenzarEmpieza gratis

Visualizar un conjunto de datos de contenido de azúcar

En este ejercicio, vas a crear un diagrama de dispersión unidimensional con 25 medidas de contenido de azúcar de refrescos. El objetivo es visualizar grupos diferenciados en el conjunto de datos como primer paso para identificar posibles fronteras de decisión.

El conjunto de datos con 25 medidas de contenido de azúcar está almacenado en la columna sugar_content del data frame df, que ya se ha precargado para ti.

Este ejercicio forma parte del curso

Máquinas de Vectores de Soporte en R

Ver curso

Instrucciones del ejercicio

  • Carga el paquete ggplot2.
  • Lista las variables del data frame df.
  • Completa el código del diagrama de dispersión. Usando el conjunto de datos df, representa el contenido de azúcar de las muestras en el eje x (con y igual a cero).
  • Escribe código de ggplot() para mostrar el contenido de azúcar en df como un diagrama de dispersión. ¿Puedes distinguir dos grupos claros que correspondan a muestras con contenido de azúcar alto y bajo?

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load ggplot2
___

# Print variable names
___

# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) + 
    geom_point() + 
    geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)

# Display plot
plot_df
Editar y ejecutar código