Previsión de la probabilidad de impago
Todo el procesamiento de datos está completo y es hora de empezar a crear predicciones de probabilidad de impago. Quieres entrenar un modelo LogisticRegression() con los datos, y examinar cómo predice la probabilidad de impago.
Para que puedas comprender mejor lo que produce el modelo con predict_proba, debes ver un registro de ejemplo junto con la probabilidad de impago prevista. ¿Cómo se comparan las cinco primeras predicciones con los valores reales de loan_status?
El conjunto de datos cr_loan_prep junto con X_train, X_test, y_train, y y_test ya se han cargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones del ejercicio
- Entrena un modelo de regresión logística con los datos de entrenamiento y guárdalo como
clf_logistic. - Utiliza
predict_proba()en los datos de prueba para crear las predicciones y almacenarlas enpreds. - Crea dos marcos de datos,
preds_dfytrue_df, para almacenar las cinco primeras predicciones y los valores verdaderos deloan_status. - Imprime
true_dfypreds_dfcomo un conjunto utilizando.concat().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))