IniziaInizia gratis

Visualizzare un insieme di dati sul contenuto di zucchero

In questo esercizio creerai uno scatter plot monodimensionale di 25 misurazioni del contenuto di zucchero di bibite. L'obiettivo è visualizzare cluster distinti nell'insieme di dati come primo passo per individuare possibili frontiere di decisione.

L'insieme di dati con 25 misurazioni del contenuto di zucchero è memorizzato nella colonna sugar_content del data frame df, che è stato precaricato per te.

Questo esercizio fa parte del corso

Support Vector Machines in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto ggplot2.
  • Elenca le variabili nel dataframe df.
  • Completa il codice dello scatter plot. Usando il dataset df, rappresenta il contenuto di zucchero dei campioni sull'asse x (con y uguale a zero).
  • Scrivi il codice ggplot() per mostrare il contenuto di zucchero in df come scatter plot. Riesci a individuare due cluster distinti corrispondenti a campioni con contenuto di zucchero alto e basso?

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load ggplot2
___

# Print variable names
___

# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) + 
    geom_point() + 
    geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)

# Display plot
plot_df
Modifica ed esegui il codice