1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Wykrywanie wartości odstających za pomocą tabel krzyżowych

Teraz musisz znaleźć i usunąć wartości odstające, które mogą znajdować się w danych. W tym ćwiczeniu możesz skorzystać z tabel krzyżowych i funkcji agregujących.

Przyjrzyj się kolumnie person_emp_length. Wcześniej używałeś argumentu aggfunc = 'mean', żeby zobaczyć średnią wartość kolumny numerycznej – do wykrywania wartości odstających możesz jednak użyć innych funkcji, takich jak min i max.

Staż pracy osoby nie może być mniejszy niż 0 ani większy niż 60. Użyj tabel krzyżowych, żeby sprawdzić dane i zobaczyć, czy takie przypadki w ogóle występują!

Zbiór danych cr_loan został już wczytany do środowiska roboczego.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Wyświetl tabelę krzyżową kolumn loan_status i person_home_ownership z maksymalną wartością person_emp_length.