Appliquer un filtre basé sur le taux de valeurs manquantes
Maintenant que vous avez calculé les taux de valeurs manquantes, vous pouvez créer un filtre à partir d’un seuil de valeurs manquantes. Dans cet exercice, nous allons choisir un seuil arbitraire mais raisonnable pour le taux de valeurs manquantes et l’appliquer à toutes les colonnes. Dans la pratique, vous prendrez du recul et personnaliserez le seuil pour chaque variable.
Le missing_vals_df, qui contient les ratios calculés dans l’exercice précédent, ainsi que le data frame house_sales_df, sont à votre disposition. Le package tidyverse a également été chargé pour vous.
Cet exercice fait partie du cours
Réduction de dimension en R
Instructions
- Utilisez
missing_vals_dfet un seuil de 0,5 pour créer un filtre de taux de valeurs manquantes et stockez-le dansmissing_vals_filter. - Appliquez
missing_vals_dfàhouse_sales_dfpour réduire sa dimensionnalité et enregistrez le nouveau data frame dansfiltered_house_sales_df.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the missing values filter
___ <- ___ %>%
___(___ <= ___) %>%
___(___)
# Apply the missing values filter
filtered_house_sales_df <- ___ %>%
___(___)
# Display the first five rows of data
___ %>% ___(___)