Trees voor wanbetalingen

Je gaat nu een gradient boosted tree-model trainen op de kredietgegevens en een voorbeeld van enkele voorspellingen bekijken. Weet je nog dat je eerder naar de voorspellingen van het logistieke regressiemodel keek? Die zagen er niet goed uit. Denk je dat dit model anders zal zijn?

De kredietgegevens cr_loan_prep, de trainingsets X_train en y_train, en de testgegevens X_test zijn beschikbaar in de werkruimte. Het XGBoost-pakket is geladen als xgb.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in Python

Bekijk cursus

Oefeninstructies

Maak en train een gradient boosted tree met XGBClassifier() en noem deze clf_gbt.
Voorspel de waarschijnlijkheid van wanbetaling op de testgegevens en sla de resultaten op in gbt_preds.
Maak twee dataframes, preds_df en true_df, om de eerste vijf voorspellingen en de echte loan_status-waarden op te slaan.
Concateneer en print de dataframes true_df en preds_df in deze volgorde en controleer de resultaten van het model.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))

# Predict with a model
____ = clf_gbt.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))

Code bewerken en uitvoeren