1. Learn
  2. /
  3. Courses
  4. /
  5. Nettoyage des données en Python

Connected

Exercise

Investisseurs manquants

Gérer les données manquantes est l’une des tâches les plus courantes en science des données. Il existe plusieurs types de valeurs manquantes, ainsi que diverses façons d’y remédier.

Vous venez de recevoir une nouvelle version du DataFrame banking contenant des données sur les montants détenus et investis pour les nouveaux et anciens clients. Cependant, certaines lignes ont une valeur inv_amount manquante.

Vous savez pertinemment que la plupart des clients de moins de 25 ans n’ont pas encore de compte de placement et vous soupçonnez que cela pourrait expliquer ces valeurs manquantes. Les modules pandas, missingno et matplotlib.pyplot ont été importés sous les alias pd, msno et plt. Le DataFrame banking est déjà chargé dans votre environnement.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Affichez le nombre de valeurs manquantes par colonne dans le DataFrame banking.
  • Tracez et affichez la matrice des valeurs manquantes de banking avec la fonction msno.matrix().