Encontrando a ordem das variáveis
O procedimento de seleção de variáveis forward stepwise começa com um conjunto vazio de variáveis e adiciona preditores um a um. Em cada etapa, é selecionado o preditor que apresenta a maior AUC em combinação com as variáveis atuais.
Neste exercício, você vai aprender a implementar o procedimento de seleção de variáveis forward stepwise. Para isso, você pode usar a função next_best, que já foi implementada para você. Ela pode ser usada da seguinte forma:
next_best(current_variables,candidate_variables,target,basetable)
onde current_variables é a lista de variáveis que já estão no modelo e candidate_variables é a lista de variáveis que podem ser adicionadas na sequência.
Este exercício faz parte do curso
Introdução à Análise Preditiva em Python
Instruções do exercício
- Use a função
next_bestpara calcular a próxima melhor variável e atribua-a anext_variable. - Atualize a lista
current_variables. - Atualize a lista
candidate_variables.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Find the candidate variables
candidate_variables = list(basetable.columns.values)
candidate_variables.remove("target")
# Initialize the current variables
current_variables = []
# The forward stepwise variable selection procedure
number_iterations = 5
for i in range(0, number_iterations):
next_variable = ____(____, ____, ["target"], basetable)
current_variables = current_variables + [____]
candidate_variables.remove(____)
print("Variable added in step " + str(i+1) + " is " + next_variable + ".")
print(current_variables)