1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Drzewa do przewidywania niespłacalności

Teraz wytrenuj model gradientowego drzewa wzmacnianego na danych kredytowych i sprawdź próbkę prognoz. Pamiętasz, gdy po raz pierwszy przeglądałeś predykcje modelu regresji logistycznej? Nie wyglądały zbyt dobrze. Czy ten model okaże się lepszy?

Dane kredytowe cr_loan_prep, zbiory treningowe X_train i y_train oraz dane testowe X_test są dostępne w środowisku pracy. Pakiet XGBoost jest załadowany jako xgb.

Instrukcje

100 XP
  • Utwórz i wytrenuj model gradientowego drzewa wzmacnianego, używając XGBClassifier(), i nadaj mu nazwę clf_gbt.
  • Przewidź prawdopodobieństwa niespłacalności na danych testowych i zapisz wyniki w zmiennej gbt_preds.
  • Utwórz dwie ramki danych – preds_df i true_df – aby przechować pierwsze pięć predykcji oraz prawdziwe wartości loan_status.
  • Połącz i wyświetl ramki danych true_df oraz preds_df w tej kolejności, a następnie sprawdź wyniki modelu.