ComenzarEmpieza gratis

Encontrar el orden de las variables

El procedimiento de selección de variables hacia delante comienza con un conjunto vacío de variables y va añadiendo predictores uno a uno. En cada paso, se selecciona el predictor que obtiene el AUC más alto en combinación con las variables actuales.

En este ejercicio aprenderás a implementar el procedimiento de selección de variables hacia delante. Para ello, puedes usar la función next_best que ya está implementada para ti. Se utiliza así:

next_best(current_variables,candidate_variables,target,basetable)

donde current_variables es la lista de variables que ya están en el modelo y candidate_variables la lista de variables que se pueden añadir a continuación.

Este ejercicio forma parte del curso

Introducción al análisis predictivo en Python

Ver curso

Instrucciones del ejercicio

  • Usa la función next_best para calcular la siguiente mejor variable y asígnala a next_variable.
  • Actualiza la lista current_variables.
  • Actualiza la lista candidate_variables.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Find the candidate variables
candidate_variables = list(basetable.columns.values)
candidate_variables.remove("target")

# Initialize the current variables
current_variables = []

# The forward stepwise variable selection procedure
number_iterations = 5
for i in range(0, number_iterations):
    next_variable = ____(____, ____, ["target"], basetable)
    current_variables = current_variables + [____]
    candidate_variables.remove(____)
    print("Variable added in step " + str(i+1)  + " is " + next_variable + ".")
print(current_variables)
Editar y ejecutar código