Extraindo um parâmetro de Regressão Logística
Agora você vai praticar a extração de um parâmetro importante do modelo de regressão logística. A regressão logística tem alguns outros parâmetros que você não vai explorar aqui, mas pode consultá-los na documentação do scikit-learn.org para o módulo LogisticRegression() em "Attributes".
Esse parâmetro é importante para entender a direção e a magnitude do efeito que as variáveis exercem sobre o alvo.
Neste exercício, vamos extrair o parâmetro de coeficientes (encontrado no atributo coef_), emparelhá-lo com os nomes das colunas originais e ver quais variáveis tiveram o maior efeito positivo sobre a variável alvo.
Você terá disponível:
- Um objeto de modelo de regressão logística chamado
log_reg_clf - O DataFrame
X_train
sklearn e pandas já foram importados para você.
Este exercício faz parte do curso
Ajuste de Hiperparâmetros em Python
Instruções do exercício
- Crie uma lista com os nomes originais das colunas usadas no DataFrame de treino.
- Extraia os coeficientes do estimador de regressão logística.
- Crie um DataFrame com os coeficientes e os nomes das variáveis e visualize-o.
- Imprima as 3 variáveis com efeito "positivo" mais forte com base no tamanho do coeficiente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a list of original variable names from the training DataFrame
original_variables = ____
# Extract the coefficients of the logistic regression estimator
model_coefficients = ____.____[____]
# Create a dataframe of the variables and coefficients & print it out
coefficient_df = pd.DataFrame({"Variable" : ____, "Coefficient": ____})
print(coefficient_df)
# Print out the top 3 positive variables
top_three_df = coefficient_df.sort_values(by=____, axis=0, ascending=____)[0:____]
print(top_three_df)