Grundlagen der logistischen Regression

Du hast die Daten bereinigt und den neuen Datensatz cr_loan_clean erstellt.

Erinnere dich an das letzte Streudiagramm aus Kapitel 1, das mehr Defaults bei hoher loan_int_rate gezeigt hat. Zinssätze sind leicht zu verstehen, aber wie hilfreich sind sie, um die Ausfallwahrscheinlichkeit vorherzusagen?

Da du die Ausfallwahrscheinlichkeit noch nicht prognostiziert hast, probiere aus, ein logistisches Regressionsmodell nur mit loan_int_rate zu erstellen und zu trainieren. Sieh dir außerdem die internen Parameter des Modells (quasi die Einstellungen) an, um die Struktur des Modells mit dieser einen Spalte zu verstehen.

Die Daten cr_loan_clean wurden bereits in den Workspace geladen.

Diese Übung ist Teil des Kurses

<Kurs>Kreditrisikomodellierung in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Erzeuge die Mengen X und y mithilfe der Spalten loan_int_rate und loan_status.
Erstelle ein logistisches Regressionsmodell, fitte es auf die Trainingsdaten und nenne es clf_logistic_single.
Gib die Parameter des Modells mit .get_params() aus.
Prüfe den Achsenabschnitt (Intercept) des Modells über das Attribut .intercept_.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create the X and y data sets
X = ____[[____]]
y = ____[[____]]

# Create and fit a logistic regression model
____ = ____()
clf_logistic_single.____(X, np.ravel(____))

# Print the parameters of the model
print(____.____())

# Print the intercept of the model
print(____.____)

Code bearbeiten und ausführen