Multivariate logistische Regression

In der Regel verwendest du nicht nur loan_int_rate, um die Ausfallwahrscheinlichkeit vorherzusagen. Du möchtest alle verfügbaren Daten nutzen, um Vorhersagen zu treffen.

Trainiere mit diesem Gedanken ein neues Modell mit verschiedenen Spalten (Features) aus den cr_loan_clean-Daten. Unterscheidet sich dieses Modell vom ersten? Das kannst du leicht über die .intercept_ der logistischen Regression prüfen. Denk daran: Das ist der y-Achsenabschnitt der Funktion und entspricht den gesamten Log-Odds für keinen Ausfall.

Die cr_loan_clean-Daten wurden zusammen mit dem vorherigen Modell clf_logistic_single in den Workspace geladen.

Diese Übung ist Teil des Kurses

<Kurs>Kreditrisikomodellierung in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle einen neuen X-Datensatz mit loan_int_rate und person_emp_length. Speichere ihn als X_multi.
Erstelle einen y-Datensatz nur mit loan_status.
Erzeuge ein LogisticRegression()-Modell und .fit() es auf den neuen X-Daten. Speichere es als clf_logistic_multi.
Gib den .intercept_-Wert des Modells aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create X data for the model
X_multi = ____[[____,____]]

# Create a set of y data for training
y = ____[[____]]

# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the intercept of the model
print(____.____)

Code bearbeiten und ausführen