Spaltenwichtigkeit und Zahlungsausfallvorhersage
Wenn du mit mehreren Trainingssätzen und vielen unterschiedlichen Spaltengruppen arbeitest, ist es wichtig, im Blick zu behalten, welche Spalten relevant sind und welche nicht. Es kann teuer oder zeitaufwendig sein, einen Satz von Spalten zu pflegen, obwohl sie möglicherweise keinen Einfluss auf loan_status haben.
Die X-Daten für diese Übung wurden mit folgendem Code erstellt:
X = cr_loan_prep[['person_income','loan_int_rate',
'loan_percent_income','loan_amnt',
'person_home_ownership_MORTGAGE','loan_grade_F']]
Trainiere ein XGBClassifier()-Modell auf diesen Daten und prüfe die Spaltenwichtigkeit, um zu sehen, wie gut jede einzelne Spalte loan_status vorhersagt.
Der Datensatz cr_loan_pret sowie X_train und y_train wurden im Workspace geladen.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Anleitung zur Übung
- Erstelle und trainiere ein
XGBClassifier()-Modell mit den TrainingssätzenX_trainundy_trainund speichere es alsclf_gbt. - Gib die Spaltenwichtigkeiten für die Spalten in
clf_gbtaus, indem du.get_booster()und.get_score()verwendest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))
# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))