ComenzarEmpieza gratis

Árboles para impagos

Ahora entrenarás un modelo de árbol con gradiente reforzado en los datos de crédito, y verás una muestra de algunas de las predicciones. ¿Recuerdas cuando observaste por primera vez las predicciones del modelo de regresión logística? No tenían buen aspecto. ¿Crees que este modelo será diferente?

Los datos de crédito cr_loan_prep, los conjuntos de entrenamiento X_train y y_train, y los datos de prueba X_test están disponibles en el espacio de trabajo. El paquete XGBoost se carga como xgb.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Instrucciones del ejercicio

  • Crea y entrena un árbol de gradiente reforzado utilizando XGBClassifier() y nómbralo clf_gbt.
  • Predice las probabilidades de incumplimiento en los datos de prueba y almacena los resultados en gbt_preds.
  • Crea dos marcos de datos, preds_df y true_df, para almacenar las cinco primeras predicciones y los valores verdaderos de loan_status.
  • Concatena e imprime los marcos de datos true_df y preds_df en orden, y comprueba los resultados del modelo.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))

# Predict with a model
____ = clf_gbt.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))
Editar y ejecutar código