1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Raport klasyfikacji dla niewykonania zobowiązania

Czas dokładniej przyjrzeć się ocenie modelu. To właśnie tutaj ustawienie progu prawdopodobieństwa niewykonania zobowiązania pomoże ci przeanalizować wydajność modelu za pomocą raportu klasyfikacji.

Utworzenie ramki danych z prawdopodobieństwami ułatwia pracę z nimi, ponieważ możesz korzystać z pełnych możliwości biblioteki pandas. Zastosuj próg do danych i sprawdź liczebność obu klas loan_status, aby zobaczyć, ile prognoz każdej z nich jest generowanych. Pozwoli to lepiej zrozumieć wyniki z raportu klasyfikacji.

Zbiór danych cr_loan_prep, wytrenowana regresja logistyczna clf_logistic, prawdziwe wartości statusu kredytu y_test oraz przewidywane prawdopodobieństwa preds są wczytane w środowisku roboczym.

Instrukcje

100 XP
  • Utwórz ramkę danych zawierającą wyłącznie prawdopodobieństwa niewykonania zobowiązania z preds i nazwij ją preds_df.
  • Przypisz ponownie wartości loan_status na podstawie progu 0.50 dla prawdopodobieństwa niewykonania zobowiązania w preds_df.
  • Wyświetl liczebność wierszy dla każdej wartości loan_status.
  • Wyświetl raport klasyfikacji, używając y_test i preds_df.