IniziaInizia gratis

Prevedere la probabilità di default

Tutta l’elaborazione dei dati è completa ed è il momento di iniziare a creare previsioni della probabilità di default. Vuoi addestrare un modello LogisticRegression() sui dati ed esaminare come predice la probabilità di default.

Per capire meglio cosa produce il modello con predict_proba, dovresti guardare un record di esempio insieme alla probabilità di default prevista. Come appaiono le prime cinque previsioni rispetto ai valori reali di loan_status?

L’insieme di dati cr_loan_prep insieme a X_train, X_test, y_train e y_test è già stato caricato nell’ambiente di lavoro.

Questo esercizio fa parte del corso

Credit Risk Modeling in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Addestra un modello di regressione logistica sui dati di training e salvalo come clf_logistic.
  • Usa predict_proba() sui dati di test per creare le previsioni e salvale in preds.
  • Crea due data frame, preds_df e true_df, per memorizzare le prime cinque previsioni e i valori reali di loan_status.
  • Stampa true_df e preds_df come un unico insieme usando .concat().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))
Modifica ed esegui il codice