1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Wizualizacja wartości odstających w danych kredytowych

W kolumnie person_emp_length wykryto wartości odstające – liczby powyżej 60 znacznie odbiegały od normy. Podobna sytuacja może wystąpić w kolumnie person_age: zdrowy rozsądek podpowiada, że osoba ubiegająca się o pożyczkę raczej nie ma ponad 100 lat.

Wizualizacja danych to kolejny prosty sposób na wykrycie wartości odstających. Możesz użyć innych kolumn numerycznych, takich jak loan_amnt i loan_int_rate, i zestawić je z person_age na wykresach w poszukiwaniu anomalii.

Zbiór danych cr_loan został już wczytany do obszaru roboczego.

Instrukcje 1/2

undefined XP
    1
    2
  • Utwórz wykres punktowy, na którym oś X przedstawia wiek osoby (person_age), a oś Y – kwotę pożyczki (loan_amnt).