CommencerCommencer gratuitement

Visualiser les données manquantes

Gérer les données manquantes est l’une des tâches les plus courantes en data science. Il existe différents types de « manquants », ainsi que plusieurs approches pour y remédier.

Vous venez de recevoir une nouvelle version du data frame accounts contenant le montant détenu et le montant investi pour les nouveaux et anciens clients. Cependant, certaines lignes ont une valeur inv_amount manquante.

Vous savez avec certitude que la plupart des clients de moins de 25 ans n’ont pas encore de comptes d’investissement, et vous soupçonnez que cela pourrait expliquer les valeurs manquantes. Les packages dplyr et visdat ont été chargés et accounts est disponible.

Cet exercice fait partie du cours

Nettoyer des données avec R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Visualize the missing values by column
___
Modifier et exécuter le code