Explora los coeficientes del modelo
Ahora vas a analizar el rendimiento del modelo desde otro ángulo y solo con los datos de entrenamiento. Algo que aprendiste en la última lección es que no todos los coeficientes del modelo son estadísticamente significativos y que conviene revisar la tabla de resumen del modelo para evaluar su significación. Por suerte, la librería statsmodels ofrece esta funcionalidad. Una vez imprimas la tabla de resumen del modelo, explora qué variables tienen un valor p inferior a 0.05 (es decir, menor que el 5 %) para asegurarte de que el coeficiente es significativo.
Las características de entrenamiento están cargadas como train_X, y la variable objetivo como train_Y, que se convirtió en un array de numpy.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Importa el módulo
statsmodels.api. - Inicializa una instancia de modelo sobre los datos de entrenamiento usando la función
OLS(). - Ajusta el modelo.
- Imprime el resumen del modelo usando el método
.summary().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import `statsmodels.api` module
import ___.___ as sm
# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)
# Fit the model
olsreg = olsreg.___()
# Print model summary
print(olsreg.___())