Explora los coeficientes de la regresión logística
Ahora vas a explorar los coeficientes de la regresión logística para entender qué hace que el churn suba o baje. En este ejercicio, extraerás los coeficientes de regresión logística del modelo ajustado y calcularás su exponencial para que sean más interpretables.
La instancia de regresión logística ajustada está cargada como logreg y las variables escaladas están cargadas como un DataFrame de pandas llamado train_X. Las librerías numpy y pandas están cargadas como np y pd, respectivamente.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Combina los nombres de las variables y los coeficientes en un DataFrame de
pandas. - Calcula el exponencial de los coeficientes de la regresión logística.
- Elimina los coeficientes que sean iguales a cero e imprímelos ordenados por el coeficiente exponencial.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Combine feature names and coefficients into pandas DataFrame
feature_names = pd.DataFrame(___.columns, columns = ['Feature'])
log_coef = pd.DataFrame(np.transpose(logreg.coef_), columns = ['Coefficient'])
coefficients = pd.concat([feature_names, ___], axis = 1)
# Calculate exponent of the logistic regression coefficients
coefficients['Exp_Coefficient'] = np.___(coefficients['Coefficient'])
# Remove coefficients that are equal to zero
coefficients = coefficients[coefficients['Coefficient']!=___]
# Print the values sorted by the exponent coefficient
print(coefficients.sort_values(by=['___']))