1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w Pythonie

Connected

ćwiczenie

Brakujący inwestorzy

Praca z brakującymi danymi to jedno z najczęstszych zadań w nauce o danych. Istnieje wiele rodzajów braków danych, a także wiele sposobów radzenia sobie z nimi.

Otrzymałeś(-aś) nową wersję DataFrame banking, zawierającą dane o środkach przechowywanych i zainwestowanych przez nowych i dotychczasowych klientów. Niektóre wiersze mają jednak brakujące wartości w kolumnie inv_amount.

Wiesz, że większość klientów poniżej 25. roku życia nie posiada jeszcze kont inwestycyjnych – podejrzewasz, że to może być przyczyną tych braków. Pakiety pandas, missingno i matplotlib.pyplot zostały zaimportowane jako pd, msno i plt. DataFrame banking jest dostępny w twoim środowisku.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Wydrukuj liczbę brakujących wartości w poszczególnych kolumnach DataFrame banking.
  • Wykreśl i wyświetl macierz braków danych dla banking, korzystając z funkcji msno.matrix().