1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Prognozowanie prawdopodobieństwa niewywiązania się ze zobowiązania

Przetwarzanie danych jest zakończone – czas przystąpić do tworzenia prognoz prawdopodobieństwa niewywiązania się ze zobowiązania. Wytrenuj model LogisticRegression() na danych i sprawdź, jak prognozuje to prawdopodobieństwo.

Aby lepiej zrozumieć, co zwraca predict_proba, porównaj przykładowy rekord z odpowiadającym mu prognozowanym prawdopodobieństwem. Jak wyglądają pierwsze pięć prognoz na tle rzeczywistych wartości loan_status?

Zbiór danych cr_loan_prep oraz zmienne X_train, X_test, y_train i y_test są już załadowane w środowisku roboczym.

Instrukcje

100 XP
  • Wytrenuj model regresji logistycznej na danych treningowych i zapisz go jako clf_logistic.
  • Użyj predict_proba() na danych testowych, aby utworzyć prognozy, i zapisz je w zmiennej preds.
  • Utwórz dwie ramki danych – preds_df i true_df – przechowujące odpowiednio pierwsze pięć prognoz oraz rzeczywiste wartości loan_status.
  • Wyświetl true_df i preds_df razem, korzystając z .concat().