LoslegenKostenlos loslegen

Multivariate logistische Regression

In der Regel verwendest du nicht nur loan_int_rate, um die Ausfallwahrscheinlichkeit vorherzusagen. Du möchtest alle verfügbaren Daten nutzen, um Vorhersagen zu treffen.

Trainiere mit diesem Gedanken ein neues Modell mit verschiedenen Spalten (Features) aus den cr_loan_clean-Daten. Unterscheidet sich dieses Modell vom ersten? Das kannst du leicht über die .intercept_ der logistischen Regression prüfen. Denk daran: Das ist der y-Achsenabschnitt der Funktion und entspricht den gesamten Log-Odds für keinen Ausfall.

Die cr_loan_clean-Daten wurden zusammen mit dem vorherigen Modell clf_logistic_single in den Workspace geladen.

Diese Übung ist Teil des Kurses

Kreditrisikomodellierung in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen neuen X-Datensatz mit loan_int_rate und person_emp_length. Speichere ihn als X_multi.
  • Erstelle einen y-Datensatz nur mit loan_status.
  • Erzeuge ein LogisticRegression()-Modell und .fit() es auf den neuen X-Daten. Speichere es als clf_logistic_multi.
  • Gib den .intercept_-Wert des Modells aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create X data for the model
X_multi = ____[[____,____]]

# Create a set of y data for training
y = ____[[____]]

# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the intercept of the model
print(____.____)
Code bearbeiten und ausführen