Créer une recette pour les valeurs manquantes
Dans les exercices précédents, vous avez calculé manuellement le ratio de valeurs manquantes et créé un filtre pour réduire la dimensionalité de house_sales_df. Le package tidymodels propose une étape de recette pour appliquer automatiquement un ratio de valeurs manquantes — step_filter_missing(). L’approche tidymodels présente l’avantage de pouvoir réutiliser la recette sur d’autres jeux de données et de faciliter le passage en production. Dans cet exercice, vous allez utiliser la fonction step_filter_missing() pour réaliser une réduction de dimension de house_sales_df basée sur les valeurs manquantes.
Les packages tidyverse et tidymodels ont été chargés pour vous.
Cet exercice fait partie du cours
Réduction de dimension en R
Instructions
- Utilisez
recipe()pour créer un filtre de valeurs manquantes avec un seuil de 0,5. - Appliquez
missing_vals_recipeàhouse_sales_df.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create missing values recipe
missing_vals_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), ___ = ___) %>%
prep()
# Apply recipe to data
___ <-
___(___, ___ = ___)
# Display the first five rows of data
___ %>% ___(___)