CommencerCommencer gratuitement

Appliquer un filtre basé sur le taux de valeurs manquantes

Maintenant que vous avez calculé les taux de valeurs manquantes, vous pouvez créer un filtre à partir d’un seuil de valeurs manquantes. Dans cet exercice, nous allons choisir un seuil arbitraire mais raisonnable pour le taux de valeurs manquantes et l’appliquer à toutes les colonnes. Dans la pratique, vous prendrez du recul et personnaliserez le seuil pour chaque variable.

Le missing_vals_df, qui contient les ratios calculés dans l’exercice précédent, ainsi que le data frame house_sales_df, sont à votre disposition. Le package tidyverse a également été chargé pour vous.

Cet exercice fait partie du cours

Réduction de dimension en R

Afficher le cours

Instructions

  • Utilisez missing_vals_df et un seuil de 0,5 pour créer un filtre de taux de valeurs manquantes et stockez-le dans missing_vals_filter.
  • Appliquez missing_vals_df à house_sales_df pour réduire sa dimensionnalité et enregistrez le nouveau data frame dans filtered_house_sales_df.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create the missing values filter
___ <- ___ %>% 
  ___(___ <= ___) %>% 
  ___(___)

# Apply the missing values filter
filtered_house_sales_df <- ___ %>% 
  ___(___)

# Display the first five rows of data
___ %>% ___(___)
Modifier et exécuter le code