1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Uzupełnianie brakujących danych kredytowych

Teraz sprawdź, czy w danych są braki. Jeśli brakujące wartości wystąpią w kolumnie loan_status, nie będzie można ich wykorzystać do prognozowania prawdopodobieństwa niewywiązania się ze spłaty – nie wiadomo bowiem, czy dany kredyt był niespłacony, czy nie. Braki w kolumnie person_emp_length są mniej krytyczne, ale nadal mogą powodować błędy podczas trenowania modelu.

Sprawdź zatem, czy w kolumnie person_emp_length są brakujące wartości, i zastąp je medianą.

Zbiór danych cr_loan jest już wczytany w obszarze roboczym.

Instrukcje

100 XP
  • Wyświetl tablicę nazw kolumn zawierających brakujące dane przy użyciu .isnull().
  • Wyświetl pięć pierwszych wierszy zbioru danych, w których brakuje wartości w kolumnie person_emp_length.
  • Zastąp brakujące wartości medianą długości zatrudnienia, używając .fillna().
  • Utwórz histogram kolumny person_emp_length, aby sprawdzić rozkład danych.