Explorer les coefficients du modèle

Vous allez maintenant examiner les performances du modèle sous un autre angle, uniquement sur les données d’entraînement. Comme vous l’avez vu dans la dernière leçon, tous les coefficients du modèle ne sont pas statistiquement significatifs ; il faut consulter le tableau récapitulatif du modèle pour évaluer leur significativité. Heureusement, la bibliothèque statsmodels offre cette fonctionnalité. Une fois le tableau récapitulatif imprimé, repérez les variables dont la p-value est inférieure à 0,05 (soit 5 %) afin de vérifier que le coefficient est significatif.

Les variables explicatives d’entraînement sont chargées sous train_X, et la variable cible sous train_Y, qui a été convertie en tableau numpy.

Cet exercice fait partie du cours

<cours>Machine Learning pour le marketing en Python</cours>

Voir le cours

Instructions de l’exercice

Importez le module statsmodels.api.
Initialisez une instance de modèle sur les données d’entraînement avec la fonction OLS().
Ajustez le modèle.
Affichez le récapitulatif du modèle à l’aide de la méthode .summary().

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import `statsmodels.api` module
import ___.___ as sm

# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)

# Fit the model
olsreg = olsreg.___()

# Print model summary
print(olsreg.___())

Modifier et exécuter le code