Verwendung verschiedener Variablensätze
Mehr Variablen und damit mehr Komplexität zu deinem logistischen Regressionsmodell hinzuzufügen, führt nicht automatisch zu genaueren Modellen. In dieser Übung kannst du überprüfen, ob das Hinzufügen von 3 Variablen zu einem Modell tatsächlich zu einem genaueren Modell führt.
variables_1 und variables_2 stehen in deiner Umgebung bereit: Du kannst sie in der Konsole ausgeben, um dir anzusehen, wie sie aussehen.
Diese Übung ist Teil des Kurses
Einführung in Predictive Analytics mit Python
Anleitung zur Übung
- Passe das
logreg-Modell mitvariables_2an, das im Vergleich zuvariables_13 zusätzliche Variablen enthält. - Erstelle Vorhersagen für dieses Modell.
- Berechne die AUC dieses Modells.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]
# Create the logistic regression model
logreg = linear_model.LogisticRegression()
# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)
# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)
# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))