Créer un filtre de valeurs manquantes
Le filtre de variance nulle ne supprime qu’une partie des variables peu informatives. Une variable peut aussi contenir peu ou pas d’information si elle comporte un grand nombre de valeurs manquantes. Dans cet exercice, vous allez créer un filtre sur les valeurs manquantes. Vous allez adopter une approche extrême et supprimer toute variable ayant au moins une valeur manquante, ce qui signifie que vous pourriez retirer des variables pourtant très informatives.
house_sales_df est disponible dans la console et le package tidyverse a été chargé pour vous.
Cet exercice fait partie du cours
Réduction de dimension en R
Instructions
- Créez un filtre de valeurs manquantes avec
summarize(),across(),sum()etis.na()pour supprimer les variables comportant zéro valeur manquante ou plus, et stockez-le dansna_filter.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a missing values filter
___ <- ___ %>%
___(across(everything(), ~ ___)) %>%
pivot_longer(everything(), names_to = "feature", values_to = "NA_count") %>%
___(___ > ___) %>%
pull(feature)
na_filter