Explorar coeficientes da regressão logística
Agora você vai explorar os coeficientes da regressão logística para entender o que está levando o churn a aumentar ou diminuir. Neste exercício, você vai extrair os coeficientes da regressão logística do seu modelo ajustado e calcular seu expoente para deixá-los mais interpretáveis.
A instância ajustada de regressão logística foi carregada como logreg e os recursos escalonados foram carregados como um DataFrame do pandas chamado train_X. As bibliotecas numpy e pandas estão carregadas como np e pd, respectivamente.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Combine os nomes das variáveis e os coeficientes em um DataFrame do
pandas. - Calcule o expoente dos coeficientes da regressão logística.
- Remova os coeficientes iguais a zero e imprima-os ordenados pelo coeficiente exponenciado.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Combine feature names and coefficients into pandas DataFrame
feature_names = pd.DataFrame(___.columns, columns = ['Feature'])
log_coef = pd.DataFrame(np.transpose(logreg.coef_), columns = ['Coefficient'])
coefficients = pd.concat([feature_names, ___], axis = 1)
# Calculate exponent of the logistic regression coefficients
coefficients['Exp_Coefficient'] = np.___(coefficients['Coefficient'])
# Remove coefficients that are equal to zero
coefficients = coefficients[coefficients['Coefficient']!=___]
# Print the values sorted by the exponent coefficient
print(coefficients.sort_values(by=['___']))