CommencerCommencer gratuitement

Créer un filtre de faible variance

Dans cet exercice, on vous fournit house_sales_df, qui contient dix-sept variables continues. Certaines de ces variables n’ont aucune variance. D’autres en ont très peu. Vous allez explorer les variances et définir un filtre à l’aide d’un seuil de variance approprié. Cette approche est utile pour réduire les dimensions qui apportent peu ou pas d’information, mais comme vous le verrez, elle présente quelques limites.

Les packages tidyverse et tidymodels ont été chargés pour vous.

Cet exercice fait partie du cours

Réduction de dimension en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate feature variances
houses_sales_variances <- ___ %>% 
  summarize(across(everything(), ~ ___(___(., ___ = ___), na.rm = ___))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "variance") %>% 
  ___(desc(___))

houses_sales_variances
Modifier et exécuter le code