Determinare l'ordine delle variabili
La procedura di selezione variabile forward stepwise parte da un insieme vuoto di variabili e aggiunge i predittori uno alla volta. A ogni passo, viene selezionato il predittore che, in combinazione con le variabili correnti, ottiene l'AUC più alta.
In questo esercizio imparerai a implementare la procedura di selezione variabile forward stepwise. A questo scopo, puoi usare la funzione next_best che è già stata implementata per te. Si usa così:
next_best(current_variables,candidate_variables,target,basetable)
dove current_variables è l'elenco delle variabili già presenti nel modello e candidate_variables l'elenco delle variabili che possono essere aggiunte nel passo successivo.
Questo esercizio fa parte del corso
Introduzione alla Predictive Analytics in Python
Istruzioni dell'esercizio
- Usa la funzione
next_bestper calcolare la prossima variabile migliore e assegnala anext_variable. - Aggiorna la lista
current_variables. - Aggiorna la lista
candidate_variables.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Find the candidate variables
candidate_variables = list(basetable.columns.values)
candidate_variables.remove("target")
# Initialize the current variables
current_variables = []
# The forward stepwise variable selection procedure
number_iterations = 5
for i in range(0, number_iterations):
next_variable = ____(____, ____, ["target"], basetable)
current_variables = current_variables + [____]
candidate_variables.remove(____)
print("Variable added in step " + str(i+1) + " is " + next_variable + ".")
print(current_variables)