Visualiser les données manquantes
Gérer les données manquantes est l’une des tâches les plus courantes en data science. Il existe différents types de « manquants », ainsi que plusieurs approches pour y remédier.
Vous venez de recevoir une nouvelle version du data frame accounts contenant le montant détenu et le montant investi pour les nouveaux et anciens clients. Cependant, certaines lignes ont une valeur inv_amount manquante.
Vous savez avec certitude que la plupart des clients de moins de 25 ans n’ont pas encore de comptes d’investissement, et vous soupçonnez que cela pourrait expliquer les valeurs manquantes. Les packages dplyr et visdat ont été chargés et accounts est disponible.
Cet exercice fait partie du cours
Nettoyer des données avec R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Visualize the missing values by column
___