Spaltenwichtigkeit visualisieren
Wenn das Modell auf unterschiedlichen Spaltensätzen trainiert wird, ändert sich die Performance. Aber ändert sich auch die Wichtigkeit derselben Spalte, je nachdem in welcher Gruppe sie enthalten ist?
Die Datensätze X2 und X3 wurden mit folgendem Code erstellt:
X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]
Zu verstehen, wie verschiedene Spalten genutzt werden, um zu einer Vorhersage von loan_status zu gelangen, ist für die Interpretierbarkeit des Modells sehr wichtig.
Die Datensätze cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test sind im Workspace geladen.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))
# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()