Visualizar un conjunto de datos de contenido de azúcar
En este ejercicio, vas a crear un diagrama de dispersión unidimensional con 25 medidas de contenido de azúcar de refrescos. El objetivo es visualizar grupos diferenciados en el conjunto de datos como primer paso para identificar posibles fronteras de decisión.
El conjunto de datos con 25 medidas de contenido de azúcar está almacenado en la columna sugar_content del data frame df, que ya se ha precargado para ti.
Este ejercicio forma parte del curso
Máquinas de Vectores de Soporte en R
Instrucciones del ejercicio
- Carga el paquete
ggplot2. - Lista las variables del data frame
df. - Completa el código del diagrama de dispersión. Usando el conjunto de datos
df, representa el contenido de azúcar de las muestras en el eje x (con y igual a cero). - Escribe código de
ggplot()para mostrar el contenido de azúcar endfcomo un diagrama de dispersión. ¿Puedes distinguir dos grupos claros que correspondan a muestras con contenido de azúcar alto y bajo?
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load ggplot2
___
# Print variable names
___
# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) +
geom_point() +
geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)
# Display plot
plot_df