Die Reihenfolge der Variablen finden
Das Forward-Stepwise-Verfahren zur Variablenauswahl startet mit einer leeren Menge an Variablen und fügt Prädiktoren nacheinander hinzu. In jedem Schritt wird der Prädiktor ausgewählt, der zusammen mit den aktuellen Variablen die höchste AUC liefert.
In dieser Übung lernst du, das Forward-Stepwise-Verfahren zur Variablenauswahl zu implementieren. Dafür kannst du die Funktion next_best verwenden, die für dich implementiert wurde. Sie kann wie folgt genutzt werden:
next_best(current_variables,candidate_variables,target,basetable)
wobei current_variables die Liste der Variablen ist, die bereits im Modell enthalten sind, und candidate_variables die Liste der Variablen, die als Nächstes hinzugefügt werden können.
Diese Übung ist Teil des Kurses
Einführung in Predictive Analytics mit Python
Anleitung zur Übung
- Verwende die Funktion
next_best, um die nächste beste Variable zu berechnen, und weise sienext_variablezu. - Aktualisiere die Liste
current_variables. - Aktualisiere die Liste
candidate_variables.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Find the candidate variables
candidate_variables = list(basetable.columns.values)
candidate_variables.remove("target")
# Initialize the current variables
current_variables = []
# The forward stepwise variable selection procedure
number_iterations = 5
for i in range(0, number_iterations):
next_variable = ____(____, ____, ["target"], basetable)
current_variables = current_variables + [____]
candidate_variables.remove(____)
print("Variable added in step " + str(i+1) + " is " + next_variable + ".")
print(current_variables)