Multivariate logistische Regression
In der Regel verwendest du nicht nur loan_int_rate, um die Ausfallwahrscheinlichkeit vorherzusagen. Du möchtest alle verfügbaren Daten nutzen, um Vorhersagen zu treffen.
Trainiere mit diesem Gedanken ein neues Modell mit verschiedenen Spalten (Features) aus den cr_loan_clean-Daten. Unterscheidet sich dieses Modell vom ersten? Das kannst du leicht über die .intercept_ der logistischen Regression prüfen. Denk daran: Das ist der y-Achsenabschnitt der Funktion und entspricht den gesamten Log-Odds für keinen Ausfall.
Die cr_loan_clean-Daten wurden zusammen mit dem vorherigen Modell clf_logistic_single in den Workspace geladen.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Anleitung zur Übung
- Erstelle einen neuen
X-Datensatz mitloan_int_rateundperson_emp_length. Speichere ihn alsX_multi. - Erstelle einen
y-Datensatz nur mitloan_status. - Erzeuge ein
LogisticRegression()-Modell und.fit()es auf den neuenX-Daten. Speichere es alsclf_logistic_multi. - Gib den
.intercept_-Wert des Modells aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create X data for the model
X_multi = ____[[____,____]]
# Create a set of y data for training
y = ____[[____]]
# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the intercept of the model
print(____.____)