ComeçarComece de graça

Encontrando a ordem das variáveis

O procedimento de seleção de variáveis forward stepwise começa com um conjunto vazio de variáveis e adiciona preditores um a um. Em cada etapa, é selecionado o preditor que apresenta a maior AUC em combinação com as variáveis atuais.

Neste exercício, você vai aprender a implementar o procedimento de seleção de variáveis forward stepwise. Para isso, você pode usar a função next_best, que já foi implementada para você. Ela pode ser usada da seguinte forma:

next_best(current_variables,candidate_variables,target,basetable)

onde current_variables é a lista de variáveis que já estão no modelo e candidate_variables é a lista de variáveis que podem ser adicionadas na sequência.

Este exercício faz parte do curso

Introdução à Análise Preditiva em Python

Ver curso

Instruções do exercício

  • Use a função next_best para calcular a próxima melhor variável e atribua-a a next_variable.
  • Atualize a lista current_variables.
  • Atualize a lista candidate_variables.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Find the candidate variables
candidate_variables = list(basetable.columns.values)
candidate_variables.remove("target")

# Initialize the current variables
current_variables = []

# The forward stepwise variable selection procedure
number_iterations = 5
for i in range(0, number_iterations):
    next_variable = ____(____, ____, ["target"], basetable)
    current_variables = current_variables + [____]
    candidate_variables.remove(____)
    print("Variable added in step " + str(i+1)  + " is " + next_variable + ".")
print(current_variables)
Editar e executar o código