Explorer les coefficients du modèle
Vous allez maintenant examiner les performances du modèle sous un autre angle, uniquement sur les données d’entraînement. Comme vous l’avez vu dans la dernière leçon, tous les coefficients du modèle ne sont pas statistiquement significatifs ; il faut consulter le tableau récapitulatif du modèle pour évaluer leur significativité. Heureusement, la bibliothèque statsmodels offre cette fonctionnalité. Une fois le tableau récapitulatif imprimé, repérez les variables dont la p-value est inférieure à 0,05 (soit 5 %) afin de vérifier que le coefficient est significatif.
Les variables explicatives d’entraînement sont chargées sous train_X, et la variable cible sous train_Y, qui a été convertie en tableau numpy.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Importez le module
statsmodels.api. - Initialisez une instance de modèle sur les données d’entraînement avec la fonction
OLS(). - Ajustez le modèle.
- Affichez le récapitulatif du modèle à l’aide de la méthode
.summary().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import `statsmodels.api` module
import ___.___ as sm
# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)
# Fit the model
olsreg = olsreg.___()
# Print model summary
print(olsreg.___())