Obésité vs. espérance de vie (OMS)
On vous fournit un échantillon de données de l’OMS (who_df) avec les pourcentages d’obésité et l’espérance de vie par pays, année et sexe. Vous souhaitez examiner visuellement la corrélation entre l’obésité et l’espérance de vie.
Cependant, les données sont très désordonnées, avec quatre variables cachées dans les noms de colonnes. Chaque nom de colonne est composé de trois parties séparées par des underscores : d’abord les valeurs de year, puis celles de sex, puis les valeurs de pct.obese ou life.exp. Comme la troisième partie du nom de colonne contient deux variables, vous devrez utiliser la valeur spéciale ".value" dans l’argument names_to.
Vous allez réorganiser les données en format ordonné (tidy) et créer le nuage de points.
Le package ggplot2 a été préchargé pour vous.
Cet exercice fait partie du cours
Reshaper des données avec tidyr
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
who_df %>%
# Put each variable in its own column
___(
___,
names_to = ___,
names_sep = "_",
names_transform = ___(___ = ___)
)