Validation croisée pour le R-carré
La validation croisée est une approche essentielle pour évaluer un modèle. Elle maximise la quantité de données disponibles pour le modèle, car celui-ci est non seulement entraîné, mais aussi testé sur toutes les données disponibles.
Dans cet exercice, vous allez construire un modèle de régression linéaire, puis utiliser la validation croisée à 6 blocs afin d’évaluer sa précision pour prédire les ventes à partir des dépenses publicitaires sur les réseaux sociaux. Vous afficherez le score individuel pour chacun des six blocs.
L’ensemble de données sales_df
a été divisé en y
pour la variable cible et X
pour les caractéristiques, et préchargé pour vous. LinearRegression
a été importé à partir de sklearn.linear_model
.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Importez
KFold
etcross_val_score
. - Créez
kf
en appelantKFold()
, en fixant le nombre de folds à six,shuffle
àTrue
, et en fixant une graine à5
. - Effectuez une validation croisée en utilisant
reg
surX
ety
, en passantkf
àcv
. - Affichez
cv_scores
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the necessary modules
from ____.____ import ____, ____
# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)
reg = LinearRegression()
# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)
# Print scores
print(____)