CommencerCommencez gratuitement

Créer une recette pour les valeurs manquantes

Dans les exercices précédents, vous avez calculé manuellement le ratio de valeurs manquantes et créé un filtre pour réduire la dimensionalité de house_sales_df. Le package tidymodels propose une étape de recette pour appliquer automatiquement un ratio de valeurs manquantes — step_filter_missing(). L’approche tidymodels présente l’avantage de pouvoir réutiliser la recette sur d’autres jeux de données et de faciliter le passage en production. Dans cet exercice, vous allez utiliser la fonction step_filter_missing() pour réaliser une réduction de dimension de house_sales_df basée sur les valeurs manquantes.

Les packages tidyverse et tidymodels ont été chargés pour vous.

Cet exercice fait partie du cours

<cours>Réduction de dimension en R</cours>
Voir le cours

Instructions de l’exercice

  • Utilisez recipe() pour créer un filtre de valeurs manquantes avec un seuil de 0,5.
  • Appliquez missing_vals_recipe à house_sales_df.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create missing values recipe
missing_vals_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___(), ___ = ___) %>% 
  prep()
  
# Apply recipe to data
___ <- 
  ___(___, ___ = ___)

# Display the first five rows of data
___ %>% ___(___)
Modifier et exécuter le code