Créer un filtre de faible variance
Dans cet exercice, on vous fournit house_sales_df, qui contient dix-sept variables continues. Certaines de ces variables n’ont aucune variance. D’autres en ont très peu. Vous allez explorer les variances et définir un filtre à l’aide d’un seuil de variance approprié. Cette approche est utile pour réduire les dimensions qui apportent peu ou pas d’information, mais comme vous le verrez, elle présente quelques limites.
Les packages tidyverse et tidymodels ont été chargés pour vous.
Cet exercice fait partie du cours
Réduction de dimension en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate feature variances
houses_sales_variances <- ___ %>%
summarize(across(everything(), ~ ___(___(., ___ = ___), na.rm = ___))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "variance") %>%
___(desc(___))
houses_sales_variances