ComeçarComece de graça

Extraindo um parâmetro de Regressão Logística

Agora você vai praticar a extração de um parâmetro importante do modelo de regressão logística. A regressão logística tem alguns outros parâmetros que você não vai explorar aqui, mas pode consultá-los na documentação do scikit-learn.org para o módulo LogisticRegression() em "Attributes".

Esse parâmetro é importante para entender a direção e a magnitude do efeito que as variáveis exercem sobre o alvo.

Neste exercício, vamos extrair o parâmetro de coeficientes (encontrado no atributo coef_), emparelhá-lo com os nomes das colunas originais e ver quais variáveis tiveram o maior efeito positivo sobre a variável alvo.

Você terá disponível:

  • Um objeto de modelo de regressão logística chamado log_reg_clf
  • O DataFrame X_train

sklearn e pandas já foram importados para você.

Este exercício faz parte do curso

Ajuste de Hiperparâmetros em Python

Ver curso

Instruções do exercício

  • Crie uma lista com os nomes originais das colunas usadas no DataFrame de treino.
  • Extraia os coeficientes do estimador de regressão logística.
  • Crie um DataFrame com os coeficientes e os nomes das variáveis e visualize-o.
  • Imprima as 3 variáveis com efeito "positivo" mais forte com base no tamanho do coeficiente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a list of original variable names from the training DataFrame
original_variables = ____

# Extract the coefficients of the logistic regression estimator
model_coefficients = ____.____[____]

# Create a dataframe of the variables and coefficients & print it out
coefficient_df = pd.DataFrame({"Variable" : ____, "Coefficient": ____})
print(coefficient_df)

# Print out the top 3 positive variables
top_three_df = coefficient_df.sort_values(by=____, axis=0, ascending=____)[0:____]
print(top_three_df)
Editar e executar o código