CommencerCommencer gratuitement

Créer une recette pour les valeurs manquantes

Dans les exercices précédents, vous avez calculé manuellement le ratio de valeurs manquantes et créé un filtre pour réduire la dimensionalité de house_sales_df. Le package tidymodels propose une étape de recette pour appliquer automatiquement un ratio de valeurs manquantes — step_filter_missing(). L’approche tidymodels présente l’avantage de pouvoir réutiliser la recette sur d’autres jeux de données et de faciliter le passage en production. Dans cet exercice, vous allez utiliser la fonction step_filter_missing() pour réaliser une réduction de dimension de house_sales_df basée sur les valeurs manquantes.

Les packages tidyverse et tidymodels ont été chargés pour vous.

Cet exercice fait partie du cours

Réduction de dimension en R

Afficher le cours

Instructions

  • Utilisez recipe() pour créer un filtre de valeurs manquantes avec un seuil de 0,5.
  • Appliquez missing_vals_recipe à house_sales_df.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create missing values recipe
missing_vals_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___(), ___ = ___) %>% 
  prep()
  
# Apply recipe to data
___ <- 
  ___(___, ___ = ___)

# Display the first five rows of data
___ %>% ___(___)
Modifier et exécuter le code