CommencerCommencer gratuitement

Visualiser un jeu de données sur la teneur en sucre

Dans cet exercice, vous allez créer un nuage de points unidimensionnel à partir de 25 mesures de teneur en sucre de boissons gazeuses. L’objectif est de visualiser des groupes distincts dans le jeu de données, première étape pour repérer d’éventuelles frontières de décision.

Le jeu de données contenant 25 mesures de teneur en sucre se trouve dans la colonne sugar_content du data frame df, qui a été préchargé pour vous.

Cet exercice fait partie du cours

Machines à vecteurs de support en R

Afficher le cours

Instructions

  • Chargez le package ggplot2.
  • Listez les variables du data frame df.
  • Complétez le code du nuage de points. En utilisant le jeu de données df, tracez la teneur en sucre des échantillons sur l’axe des x (avec y égal à zéro).
  • Écrivez le code ggplot() pour afficher la teneur en sucre dans df sous forme de nuage de points. Pouvez-vous distinguer deux groupes, correspondant aux échantillons à forte et faible teneur en sucre ?

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load ggplot2
___

# Print variable names
___

# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) + 
    geom_point() + 
    geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)

# Display plot
plot_df
Modifier et exécuter le code