Árboles para impagos
Ahora entrenarás un modelo de árbol con gradiente reforzado en los datos de crédito, y verás una muestra de algunas de las predicciones. ¿Recuerdas cuando observaste por primera vez las predicciones del modelo de regresión logística? No tenían buen aspecto. ¿Crees que este modelo será diferente?
Los datos de crédito cr_loan_prep
, los conjuntos de entrenamiento X_train
y y_train
, y los datos de prueba X_test
están disponibles en el espacio de trabajo. El paquete XGBoost se carga como xgb
.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones del ejercicio
- Crea y entrena un árbol de gradiente reforzado utilizando
XGBClassifier()
y nómbraloclf_gbt
. - Predice las probabilidades de incumplimiento en los datos de prueba y almacena los resultados en
gbt_preds
. - Crea dos marcos de datos,
preds_df
ytrue_df
, para almacenar las cinco primeras predicciones y los valores verdaderos deloan_status
. - Concatena e imprime los marcos de datos
true_df
ypreds_df
en orden, y comprueba los resultados del modelo.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))
# Predict with a model
____ = clf_gbt.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))