Valider l’âge
Maintenant que vous avez trouvé des incohérences dans les montants total, vous soupçonnez qu’il peut aussi y en avoir dans la colonne acct_age, et vous voulez vérifier si ces incohérences sont liées. En vous appuyant sur les compétences vues dans la vidéo, vous allez valider l’âge de chaque compte et vérifier si les lignes dont acct_age est incohérent sont les mêmes que celles dont le total était incohérent.
dplyr et lubridate sont chargés et accounts est disponible.
Cet exercice fait partie du cours
Nettoyer des données avec R
Instructions
- Créez une nouvelle colonne appelée
theoretical_agequi contient l’âge de chaque compte d’aprèsdate_opened. - Recherchez les comptes pour lesquels
acct_agene correspond pas àtheoretical_age.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Find invalid acct_age
accounts %>%
# theoretical_age: age of acct based on date_opened
mutate(theoretical_age = ___) %>%
# Filter for rows where acct_age is different from theoretical_age
___