Pas membre
Maintenant que vous avez pratiqué l’identification des problèmes liés aux contraintes d’appartenance, il est temps de les corriger dans un nouveau jeu de données. Tout au long de ce chapitre, vous allez travailler avec un jeu de données appelé sfo_survey, qui contient les réponses d’un sondage mené auprès de passagers prenant des vols au départ de l’aéroport international de San Francisco (SFO). Les participants ont été interrogés sur la propreté de l’aéroport, les temps d’attente, la sécurité et leur satisfaction globale.
Quelques problèmes sont survenus lors de la collecte des données, entraînant certaines incohérences dans le jeu de données. Dans cet exercice, vous allez travailler sur la colonne dest_size, qui catégorise la taille de l’aéroport de destination vers lequel les passagers se rendaient. Un data frame appelé dest_sizes est disponible et contient toutes les tailles de destination possibles. Votre mission est de trouver les lignes avec des dest_size non valides et de les supprimer du data frame.
dplyr a été chargé et sfo_survey ainsi que dest_sizes sont disponibles.
Cet exercice fait partie du cours
Nettoyer des données avec R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Count the number of occurrences of dest_size
sfo_survey %>%
count(___)