Grundlagen der logistischen Regression
Du hast die Daten bereinigt und den neuen Datensatz cr_loan_clean erstellt.
Erinnere dich an das letzte Streudiagramm aus Kapitel 1, das mehr Defaults bei hoher loan_int_rate gezeigt hat. Zinssätze sind leicht zu verstehen, aber wie hilfreich sind sie, um die Ausfallwahrscheinlichkeit vorherzusagen?
Da du die Ausfallwahrscheinlichkeit noch nicht prognostiziert hast, probiere aus, ein logistisches Regressionsmodell nur mit loan_int_rate zu erstellen und zu trainieren. Sieh dir außerdem die internen Parameter des Modells (quasi die Einstellungen) an, um die Struktur des Modells mit dieser einen Spalte zu verstehen.
Die Daten cr_loan_clean wurden bereits in den Workspace geladen.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Anleitung zur Übung
- Erzeuge die Mengen
Xundymithilfe der Spaltenloan_int_rateundloan_status. - Erstelle ein logistisches Regressionsmodell, fitte es auf die Trainingsdaten und nenne es
clf_logistic_single. - Gib die Parameter des Modells mit
.get_params()aus. - Prüfe den Achsenabschnitt (Intercept) des Modells über das Attribut
.intercept_.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the X and y data sets
X = ____[[____]]
y = ____[[____]]
# Create and fit a logistic regression model
____ = ____()
clf_logistic_single.____(X, np.ravel(____))
# Print the parameters of the model
print(____.____())
# Print the intercept of the model
print(____.____)