Curvas de calibración
Ahora sabes que el árbol de gradiente reforzado clf_gbt
tiene el mejor rendimiento global. Tienes que comprobar la calibración de los dos modelos para ver lo estable que es el rendimiento de la predicción por defecto a través de las probabilidades. Puedes utilizar un gráfico del calibrado de cada modelo para comprobarlo llamando a la función calibration_curve()
.
Las curvas de calibración pueden requerir muchas líneas de código en Python, por lo que recorrerás cada paso lentamente para añadir los distintos componentes.
Los dos conjuntos de predicciones clf_logistic_preds
y clf_gbt_preds
ya se han cargado en el espacio de trabajo. Además, la salida de calibration_curve()
para cada modelo se ha cargado como: frac_of_pos_lr
, mean_pred_val_lr
, frac_of_pos_gbt
, y mean_pred_val_gbt
.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create the calibration curve plot with the guideline
plt.____([0, 1], [0, 1], 'k:', label=____)
plt.____('Fraction of positives')
plt.____('Average Predicted Probability')
plt.legend()
plt.title('Calibration Curve')
plt.____()