Extraer un parámetro de Logistic Regression
Ahora vas a practicar cómo extraer un parámetro importante del modelo de logistic regression. Logistic regression tiene otros parámetros que no explorarás aquí, pero puedes revisarlos en la documentación de scikit-learn.org para el módulo LogisticRegression() en la sección «Attributes».
Este parámetro es importante para entender la dirección y la magnitud del efecto que las variables ejercen sobre la variable objetivo.
En este ejercicio extraeremos el parámetro de coeficientes (en el atributo coef_), lo uniremos con los nombres de las columnas originales y veremos qué variables tienen el mayor efecto positivo sobre la variable objetivo.
Tendrás disponible:
- Un objeto de modelo de logistic regression llamado
log_reg_clf - El DataFrame
X_train
Ya se han importado sklearn y pandas para ti.
Este ejercicio forma parte del curso
Ajuste de hiperparámetros en Python
Instrucciones del ejercicio
- Crea una lista con los nombres de las columnas originales usadas en el DataFrame de entrenamiento.
- Extrae los coeficientes del estimador de logistic regression.
- Crea un DataFrame con los coeficientes y los nombres de las variables y míralo.
- Imprime las 3 variables con efecto más «positivo» según el valor del coeficiente.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a list of original variable names from the training DataFrame
original_variables = ____
# Extract the coefficients of the logistic regression estimator
model_coefficients = ____.____[____]
# Create a dataframe of the variables and coefficients & print it out
coefficient_df = pd.DataFrame({"Variable" : ____, "Coefficient": ____})
print(coefficient_df)
# Print out the top 3 positive variables
top_three_df = coefficient_df.sort_values(by=____, axis=0, ascending=____)[0:____]
print(top_three_df)