Ausfallwahrscheinlichkeit vorhersagen

Die Datenvorbereitung ist abgeschlossen und es ist Zeit, Vorhersagen für die Ausfallwahrscheinlichkeit zu erstellen. Du möchtest ein LogisticRegression()-Modell auf den Daten trainieren und dir ansehen, wie es die Ausfallwahrscheinlichkeit schätzt.

Damit du besser verstehst, was das Modell mit predict_proba liefert, solltest du dir einen Beispiel-Datensatz zusammen mit der vorhergesagten Ausfallwahrscheinlichkeit ansehen. Wie sehen die ersten fünf Vorhersagen im Vergleich zu den tatsächlichen Werten von loan_status aus?

Der Datensatz cr_loan_prep sowie X_train, X_test, y_train und y_test sind bereits in der Arbeitsumgebung geladen.

Diese Übung ist Teil des Kurses

<Kurs>Kreditrisikomodellierung in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Trainiere ein Logistische-Regression-Modell auf den Trainingsdaten und speichere es als clf_logistic.
Verwende predict_proba() auf den Testdaten, um die Vorhersagen zu erstellen, und speichere sie in preds.
Erstelle zwei DataFrames, preds_df und true_df, um die ersten fünf Vorhersagen und die wahren loan_status-Werte zu speichern.
Gib true_df und preds_df gemeinsam mit .concat() aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))

Code bearbeiten und ausführen