1. Apprendre
  2. /
  3. Cours
  4. /
  5. Apprentissage supervisé avec scikit-learn

Connected

Exercice

Validation croisée pour R-squared

La validation croisée est essentielle pour évaluer un modèle. Elle maximise la quantité de données accessibles au modèle, puisque celui-ci est non seulement entraîné, mais aussi testé sur l'ensemble des données disponibles.

Dans cet exercice, vous allez créer un modèle de régression linéaire, puis utiliser une validation croisée à 6 volets pour évaluer sa justesse à prédire les ventes à partir des dépenses publicitaires sur les médias sociaux. Vous afficherez le score individuel pour chacun des six volets.

Le jeu de données sales_df a été séparé en y pour la variable cible et X pour les variables explicatives, et il est déjà chargé pour vous. LinearRegression a été importé depuis sklearn.linear_model.

Instructions

100 XP
  • Importez KFold et cross_val_score.
  • Créez kf en appelant KFold(), en fixant le nombre de partitions à six, shuffle à True, et une graine aléatoire de 5.
  • Effectuez la validation croisée en utilisant reg sur X et y, en passant kf à cv.
  • Affichez cv_scores.