Transformation log10 de la surface de la maison
Vous venez de voir que la variable prédictive sqft_living est asymétrique vers la droite ; une transformation en logarithme base 10 est donc pertinente pour la rendre plus symétrique. Comme nous avons transformé la variable cible price pour créer log10_price dans la vidéo, faisons de même pour sqft_living.
Cet exercice fait partie du cours
Modéliser des données avec le Tidyverse
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load packages
library(moderndive)
library(dplyr)
library(ggplot2)
# Add log10_size
house_prices_2 <- house_prices %>%
___(___ = ___(___))