Identifier les incohérences
Dans la vidéo d’exercices, vous avez découvert plusieurs types d’incohérences possibles au sein de catégories, pouvant donner l’impression qu’une variable comporte plus de modalités qu’elle ne devrait.
Dans cet exercice, vous continuez à travailler avec le jeu de données sfo_survey. Vous allez à nouveau examiner la colonne dest_size, ainsi que la colonne cleanliness, et déterminer quels types de problèmes, le cas échéant, affectent ces deux variables catégorielles.
dplyr est chargé et sfo_survey est disponible.
Cet exercice fait partie du cours
Nettoyer des données avec R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Count dest_size
sfo_survey %>%
___