Visualiser un jeu de données sur la teneur en sucre
Dans cet exercice, vous allez créer un nuage de points unidimensionnel à partir de 25 mesures de teneur en sucre de boissons gazeuses. L’objectif est de visualiser des groupes distincts dans le jeu de données, première étape pour repérer d’éventuelles frontières de décision.
Le jeu de données contenant 25 mesures de teneur en sucre se trouve dans la colonne sugar_content du data frame df, qui a été préchargé pour vous.
Cet exercice fait partie du cours
Machines à vecteurs de support en R
Instructions
- Chargez le package
ggplot2. - Listez les variables du data frame
df. - Complétez le code du nuage de points. En utilisant le jeu de données
df, tracez la teneur en sucre des échantillons sur l’axe des x (avec y égal à zéro). - Écrivez le code
ggplot()pour afficher la teneur en sucre dansdfsous forme de nuage de points. Pouvez-vous distinguer deux groupes, correspondant aux échantillons à forte et faible teneur en sucre ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load ggplot2
___
# Print variable names
___
# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) +
geom_point() +
geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)
# Display plot
plot_df