LoslegenKostenlos loslegen

Die Reihenfolge der Variablen finden

Das Forward-Stepwise-Verfahren zur Variablenauswahl startet mit einer leeren Menge an Variablen und fügt Prädiktoren nacheinander hinzu. In jedem Schritt wird der Prädiktor ausgewählt, der zusammen mit den aktuellen Variablen die höchste AUC liefert.

In dieser Übung lernst du, das Forward-Stepwise-Verfahren zur Variablenauswahl zu implementieren. Dafür kannst du die Funktion next_best verwenden, die für dich implementiert wurde. Sie kann wie folgt genutzt werden:

next_best(current_variables,candidate_variables,target,basetable)

wobei current_variables die Liste der Variablen ist, die bereits im Modell enthalten sind, und candidate_variables die Liste der Variablen, die als Nächstes hinzugefügt werden können.

Diese Übung ist Teil des Kurses

Einführung in Predictive Analytics mit Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Funktion next_best, um die nächste beste Variable zu berechnen, und weise sie next_variable zu.
  • Aktualisiere die Liste current_variables.
  • Aktualisiere die Liste candidate_variables.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Find the candidate variables
candidate_variables = list(basetable.columns.values)
candidate_variables.remove("target")

# Initialize the current variables
current_variables = []

# The forward stepwise variable selection procedure
number_iterations = 5
for i in range(0, number_iterations):
    next_variable = ____(____, ____, ["target"], basetable)
    current_variables = current_variables + [____]
    candidate_variables.remove(____)
    print("Variable added in step " + str(i+1)  + " is " + next_variable + ".")
print(current_variables)
Code bearbeiten und ausführen