Kolombelang en wanbetalingsvoorspelling
Als je meerdere trainingssets gebruikt met verschillende groepen kolommen, is het belangrijk om in de gaten te houden welke kolommen ertoe doen en welke niet. Het kan duur of tijdrovend zijn om een set kolommen te onderhouden die geen invloed heeft op loan_status.
De X-gegevens voor deze oefening zijn aangemaakt met de volgende code:
X = cr_loan_prep[['person_income','loan_int_rate',
'loan_percent_income','loan_amnt',
'person_home_ownership_MORTGAGE','loan_grade_F']]
Train een XGBClassifier()-model op deze gegevens en bekijk de kolombelangen om te zien hoe elke kolom presteert bij het voorspellen van loan_status.
De gegevensset cr_loan_pret samen met X_train en y_train zijn in de werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in Python
Oefeninstructies
- Maak en train een
XGBClassifier()-model op de trainingssetsX_traineny_trainen sla dit op alsclf_gbt. - Print de kolombelangen voor de kolommen in
clf_gbtmet.get_booster()en.get_score().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))
# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))