Transformations
Des distributions très asymétriques rendent l’interprétation des visualisations difficile. Les transformations peuvent aider à révéler une structure plus subtile.
Ici, vous allez vous concentrer sur la variable de population, qui présente une forte asymétrie à droite, et l’appliquer au logarithme naturel (log() en R).
Cet exercice fait partie du cours
Analyse exploratoire des données en R
Instructions
En utilisant les données gap2007 :
- Créez un tracé de densité de la variable population.
- Créez une nouvelle colonne appelée
log_popcorrespondant au logarithme naturel de la population, puis enregistrez-la dansgap2007. - Créez un tracé de densité de votre variable transformée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create density plot of old variable
gap2007 %>%
ggplot(aes(x = ___)) +
___
# Transform the skewed pop variable
gap2007 <- gap2007 %>%
mutate(___)
# Create density plot of new variable
gap2007 %>%
ggplot(aes(x = ___)) +
___