Explora los coeficientes del modelo

Ahora vas a analizar el rendimiento del modelo desde otro ángulo y solo con los datos de entrenamiento. Algo que aprendiste en la última lección es que no todos los coeficientes del modelo son estadísticamente significativos y que conviene revisar la tabla de resumen del modelo para evaluar su significación. Por suerte, la librería statsmodels ofrece esta funcionalidad. Una vez imprimas la tabla de resumen del modelo, explora qué variables tienen un valor p inferior a 0.05 (es decir, menor que el 5 %) para asegurarte de que el coeficiente es significativo.

Las características de entrenamiento están cargadas como train_X, y la variable objetivo como train_Y, que se convirtió en un array de numpy.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

Importa el módulo statsmodels.api.
Inicializa una instancia de modelo sobre los datos de entrenamiento usando la función OLS().
Ajusta el modelo.
Imprime el resumen del modelo usando el método .summary().

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Import `statsmodels.api` module
import ___.___ as sm

# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)

# Fit the model
olsreg = olsreg.___()

# Print model summary
print(olsreg.___())

Editar y ejecutar código