Previsión de la probabilidad de impago

Todo el procesamiento de datos está completo y es hora de empezar a crear predicciones de probabilidad de impago. Quieres entrenar un modelo LogisticRegression() con los datos, y examinar cómo predice la probabilidad de impago.

Para que puedas comprender mejor lo que produce el modelo con predict_proba, debes ver un registro de ejemplo junto con la probabilidad de impago prevista. ¿Cómo se comparan las cinco primeras predicciones con los valores reales de loan_status?

El conjunto de datos cr_loan_prep junto con X_train, X_test, y_train, y y_test ya se han cargado en el espacio de trabajo.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Instrucciones del ejercicio

Entrena un modelo de regresión logística con los datos de entrenamiento y guárdalo como clf_logistic.
Utiliza predict_proba() en los datos de prueba para crear las predicciones y almacenarlas en preds.
Crea dos marcos de datos, preds_df y true_df, para almacenar las cinco primeras predicciones y los valores verdaderos de loan_status.
Imprime true_df y preds_df como un conjunto utilizando .concat().

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))

Editar y ejecutar código