Kolombelang en wanbetalingsvoorspelling

Als je meerdere trainingssets gebruikt met verschillende groepen kolommen, is het belangrijk om in de gaten te houden welke kolommen ertoe doen en welke niet. Het kan duur of tijdrovend zijn om een set kolommen te onderhouden die geen invloed heeft op loan_status.

De X-gegevens voor deze oefening zijn aangemaakt met de volgende code:

X = cr_loan_prep[['person_income','loan_int_rate',
                  'loan_percent_income','loan_amnt',
                  'person_home_ownership_MORTGAGE','loan_grade_F']]

Train een XGBClassifier()-model op deze gegevens en bekijk de kolombelangen om te zien hoe elke kolom presteert bij het voorspellen van loan_status.

De gegevensset cr_loan_pret samen met X_train en y_train zijn in de werkruimte geladen.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in Python

Bekijk cursus

Oefeninstructies

Maak en train een XGBClassifier()-model op de trainingssets X_train en y_train en sla dit op als clf_gbt.
Print de kolombelangen voor de kolommen in clf_gbt met .get_booster() en .get_score().

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))

# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))

Code bewerken en uitvoeren