LoslegenKostenlos loslegen

Einen Parameter der logistischen Regression extrahieren

Jetzt übst du, einen wichtigen Parameter des Modells für logistische Regression zu extrahieren. Die logistische Regression hat noch ein paar weitere Parameter, die du hier nicht untersuchst, aber du kannst sie in der Dokumentation auf scikit-learn.org für das Modul LogisticRegression() unter „Attributes“ nachlesen.

Dieser Parameter ist wichtig, um Richtung und Stärke des Effekts zu verstehen, den die Variablen auf das Ziel haben.

In dieser Übung extrahieren wir den Koeffizienten-Parameter (zu finden im Attribut coef_), kombinieren ihn mit den ursprünglichen Spaltennamen und sehen uns an, welche Variablen den größten positiven Effekt auf die Zielvariable hatten.

Dir stehen zur Verfügung:

  • Ein Objekt des Modells für logistische Regression namens log_reg_clf
  • Der DataFrame X_train

sklearn und pandas wurden für dich importiert.

Diese Übung ist Teil des Kurses

Hyperparameter-Tuning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Liste der ursprünglichen Spaltennamen, die im Trainings-DataFrame verwendet wurden.
  • Extrahiere die Koeffizienten des Schätzers für die logistische Regression.
  • Erstelle einen DataFrame aus Koeffizienten und Variablennamen und zeige ihn an.
  • Gib die Top 3 der „positiven“ Variablen basierend auf der Größe des Koeffizienten aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a list of original variable names from the training DataFrame
original_variables = ____

# Extract the coefficients of the logistic regression estimator
model_coefficients = ____.____[____]

# Create a dataframe of the variables and coefficients & print it out
coefficient_df = pd.DataFrame({"Variable" : ____, "Coefficient": ____})
print(coefficient_df)

# Print out the top 3 positive variables
top_three_df = coefficient_df.sort_values(by=____, axis=0, ascending=____)[0:____]
print(top_three_df)
Code bearbeiten und ausführen