Encontrar el orden de las variables
El procedimiento de selección de variables hacia delante comienza con un conjunto vacío de variables y va añadiendo predictores uno a uno. En cada paso, se selecciona el predictor que obtiene el AUC más alto en combinación con las variables actuales.
En este ejercicio aprenderás a implementar el procedimiento de selección de variables hacia delante. Para ello, puedes usar la función next_best que ya está implementada para ti. Se utiliza así:
next_best(current_variables,candidate_variables,target,basetable)
donde current_variables es la lista de variables que ya están en el modelo y candidate_variables la lista de variables que se pueden añadir a continuación.
Este ejercicio forma parte del curso
Introducción al análisis predictivo en Python
Instrucciones del ejercicio
- Usa la función
next_bestpara calcular la siguiente mejor variable y asígnala anext_variable. - Actualiza la lista
current_variables. - Actualiza la lista
candidate_variables.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Find the candidate variables
candidate_variables = list(basetable.columns.values)
candidate_variables.remove("target")
# Initialize the current variables
current_variables = []
# The forward stepwise variable selection procedure
number_iterations = 5
for i in range(0, number_iterations):
next_variable = ____(____, ____, ["target"], basetable)
current_variables = current_variables + [____]
candidate_variables.remove(____)
print("Variable added in step " + str(i+1) + " is " + next_variable + ".")
print(current_variables)