Prevedere la probabilità di default

Tutta l’elaborazione dei dati è completa ed è il momento di iniziare a creare previsioni della probabilità di default. Vuoi addestrare un modello LogisticRegression() sui dati ed esaminare come predice la probabilità di default.

Per capire meglio cosa produce il modello con predict_proba, dovresti guardare un record di esempio insieme alla probabilità di default prevista. Come appaiono le prime cinque previsioni rispetto ai valori reali di loan_status?

L’insieme di dati cr_loan_prep insieme a X_train, X_test, y_train e y_test è già stato caricato nell’ambiente di lavoro.

Questo esercizio fa parte del corso

Credit Risk Modeling in Python

Visualizza corso

Istruzioni dell'esercizio

Addestra un modello di regressione logistica sui dati di training e salvalo come clf_logistic.
Usa predict_proba() sui dati di test per creare le previsioni e salvale in preds.
Crea due data frame, preds_df e true_df, per memorizzare le prime cinque previsioni e i valori reali di loan_status.
Stampa true_df e preds_df come un unico insieme usando .concat().

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))

Modifica ed esegui il codice