Importancia de la columna y previsión de impago

Cuando se utilizan varios conjuntos de entrenamiento con muchos grupos diferentes de columnas, es importante vigilar qué columnas importan y cuáles no. Puede resultar caro o llevar mucho tiempo mantener un conjunto de columnas aunque no tengan ninguna repercusión en loan_status.

Los datos de X para este ejercicio se crearon con el siguiente código:

X = cr_loan_prep[['person_income','loan_int_rate',

                  'loan_percent_income','loan_amnt',

                  'person_home_ownership_MORTGAGE','loan_grade_F']]

Entrena un modelo XGBClassifier() con estos datos, y comprueba la importancia de las columnas para ver cómo funciona cada una para predecir loan_status.

El conjunto de datos cr_loan_pret junto con X_train e y_train se han cargado en el espacio de trabajo.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Instrucciones del ejercicio

Crea y entrena un modelo XGBClassifier() en los conjuntos de entrenamiento X_train e y_train, y guárdalo como clf_gbt.
Imprime las importancias de las columnas de clf_gbt utilizando .get_booster() y .get_score().

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))

# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))

Editar y ejecutar código