Prevedere la probabilità di default
Tutta l’elaborazione dei dati è completa ed è il momento di iniziare a creare previsioni della probabilità di default. Vuoi addestrare un modello LogisticRegression() sui dati ed esaminare come predice la probabilità di default.
Per capire meglio cosa produce il modello con predict_proba, dovresti guardare un record di esempio insieme alla probabilità di default prevista. Come appaiono le prime cinque previsioni rispetto ai valori reali di loan_status?
L’insieme di dati cr_loan_prep insieme a X_train, X_test, y_train e y_test è già stato caricato nell’ambiente di lavoro.
Questo esercizio fa parte del corso
Credit Risk Modeling in Python
Istruzioni dell'esercizio
- Addestra un modello di regressione logistica sui dati di training e salvalo come
clf_logistic. - Usa
predict_proba()sui dati di test per creare le previsioni e salvale inpreds. - Crea due data frame,
preds_dfetrue_df, per memorizzare le prime cinque previsioni e i valori reali diloan_status. - Stampa
true_dfepreds_dfcome un unico insieme usando.concat().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))