Trees voor wanbetalingen
Je gaat nu een gradient boosted tree-model trainen op de kredietgegevens en een voorbeeld van enkele voorspellingen bekijken. Weet je nog dat je eerder naar de voorspellingen van het logistieke regressiemodel keek? Die zagen er niet goed uit. Denk je dat dit model anders zal zijn?
De kredietgegevens cr_loan_prep, de trainingsets X_train en y_train, en de testgegevens X_test zijn beschikbaar in de werkruimte. Het XGBoost-pakket is geladen als xgb.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in Python
Oefeninstructies
- Maak en train een gradient boosted tree met
XGBClassifier()en noem dezeclf_gbt. - Voorspel de waarschijnlijkheid van wanbetaling op de testgegevens en sla de resultaten op in
gbt_preds. - Maak twee dataframes,
preds_dfentrue_df, om de eerste vijf voorspellingen en de echteloan_status-waarden op te slaan. - Concateneer en print de dataframes
true_dfenpreds_dfin deze volgorde en controleer de resultaten van het model.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))
# Predict with a model
____ = clf_gbt.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))