Visualizzare un insieme di dati sul contenuto di zucchero
In questo esercizio creerai uno scatter plot monodimensionale di 25 misurazioni del contenuto di zucchero di bibite. L'obiettivo è visualizzare cluster distinti nell'insieme di dati come primo passo per individuare possibili frontiere di decisione.
L'insieme di dati con 25 misurazioni del contenuto di zucchero è memorizzato nella colonna sugar_content del data frame df, che è stato precaricato per te.
Questo esercizio fa parte del corso
Support Vector Machines in R
Istruzioni dell'esercizio
- Carica il pacchetto
ggplot2. - Elenca le variabili nel dataframe
df. - Completa il codice dello scatter plot. Usando il dataset
df, rappresenta il contenuto di zucchero dei campioni sull'asse x (con y uguale a zero). - Scrivi il codice
ggplot()per mostrare il contenuto di zucchero indfcome scatter plot. Riesci a individuare due cluster distinti corrispondenti a campioni con contenuto di zucchero alto e basso?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load ggplot2
___
# Print variable names
___
# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) +
geom_point() +
geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)
# Display plot
plot_df