Ausfallwahrscheinlichkeit vorhersagen
Die Datenvorbereitung ist abgeschlossen und es ist Zeit, Vorhersagen für die Ausfallwahrscheinlichkeit zu erstellen. Du möchtest ein LogisticRegression()-Modell auf den Daten trainieren und dir ansehen, wie es die Ausfallwahrscheinlichkeit schätzt.
Damit du besser verstehst, was das Modell mit predict_proba liefert, solltest du dir einen Beispiel-Datensatz zusammen mit der vorhergesagten Ausfallwahrscheinlichkeit ansehen. Wie sehen die ersten fünf Vorhersagen im Vergleich zu den tatsächlichen Werten von loan_status aus?
Der Datensatz cr_loan_prep sowie X_train, X_test, y_train und y_test sind bereits in der Arbeitsumgebung geladen.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Anleitung zur Übung
- Trainiere ein Logistische-Regression-Modell auf den Trainingsdaten und speichere es als
clf_logistic. - Verwende
predict_proba()auf den Testdaten, um die Vorhersagen zu erstellen, und speichere sie inpreds. - Erstelle zwei DataFrames,
preds_dfundtrue_df, um die ersten fünf Vorhersagen und die wahrenloan_status-Werte zu speichern. - Gib
true_dfundpreds_dfgemeinsam mit.concat()aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))