1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Usuwanie brakujących danych

Uzupełniłeś brakujące dane w kolumnie person_emp_length, ale w poprzednim ćwiczeniu zauważyłeś, że kolumna loan_int_rate również zawiera brakujące wartości.

Podobnie jak w przypadku loan_status, brakujące dane w loan_int_rate utrudnią tworzenie prognoz.

Ponieważ stopy procentowe są ustalane przez twoją firmę, brakujące wartości w tej kolumnie są bardzo podejrzane. Możliwe, że błędy pojawiły się podczas importu danych, ale nie można tego stwierdzić z pewnością. Na razie najlepiej usunąć te rekordy metodą .drop() przed dalszą analizą.

Zbiór danych cr_loan jest już załadowany w środowisku.

Instrukcje

100 XP
  • Wyświetl liczbę rekordów zawierających brakujące dane dla stopy procentowej.
  • Utwórz tablicę indeksów wierszy z brakującą stopą procentową i nadaj jej nazwę indices.
  • Usuń rekordy z brakującą stopą procentową i zapisz wynik do cr_loan_clean.