ComenzarEmpieza gratis

Extraer un parámetro de Logistic Regression

Ahora vas a practicar cómo extraer un parámetro importante del modelo de logistic regression. Logistic regression tiene otros parámetros que no explorarás aquí, pero puedes revisarlos en la documentación de scikit-learn.org para el módulo LogisticRegression() en la sección «Attributes».

Este parámetro es importante para entender la dirección y la magnitud del efecto que las variables ejercen sobre la variable objetivo.

En este ejercicio extraeremos el parámetro de coeficientes (en el atributo coef_), lo uniremos con los nombres de las columnas originales y veremos qué variables tienen el mayor efecto positivo sobre la variable objetivo.

Tendrás disponible:

  • Un objeto de modelo de logistic regression llamado log_reg_clf
  • El DataFrame X_train

Ya se han importado sklearn y pandas para ti.

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

Ver curso

Instrucciones del ejercicio

  • Crea una lista con los nombres de las columnas originales usadas en el DataFrame de entrenamiento.
  • Extrae los coeficientes del estimador de logistic regression.
  • Crea un DataFrame con los coeficientes y los nombres de las variables y míralo.
  • Imprime las 3 variables con efecto más «positivo» según el valor del coeficiente.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a list of original variable names from the training DataFrame
original_variables = ____

# Extract the coefficients of the logistic regression estimator
model_coefficients = ____.____[____]

# Create a dataframe of the variables and coefficients & print it out
coefficient_df = pd.DataFrame({"Variable" : ____, "Coefficient": ____})
print(coefficient_df)

# Print out the top 3 positive variables
top_three_df = coefficient_df.sort_values(by=____, axis=0, ascending=____)[0:____]
print(top_three_df)
Editar y ejecutar código