CommencerCommencer gratuitement

Validation croisée pour le R-carré

La validation croisée est une approche essentielle pour évaluer un modèle. Elle maximise la quantité de données disponibles pour le modèle, car celui-ci est non seulement entraîné, mais aussi testé sur toutes les données disponibles.

Dans cet exercice, vous allez construire un modèle de régression linéaire, puis utiliser la validation croisée à 6 blocs afin d’évaluer sa précision pour prédire les ventes à partir des dépenses publicitaires sur les réseaux sociaux. Vous afficherez le score individuel pour chacun des six blocs.

L’ensemble de données sales_df a été divisé en y pour la variable cible et X pour les caractéristiques, et préchargé pour vous. LinearRegression a été importé à partir de sklearn.linear_model.

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Instructions

  • Importez KFold et cross_val_score.
  • Créez kf en appelant KFold(), en fixant le nombre de folds à six, shuffle à True, et en fixant une graine à 5.
  • Effectuez une validation croisée en utilisant reg sur X et y, en passant kf à cv.
  • Affichez cv_scores.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the necessary modules
from ____.____ import ____, ____

# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)

reg = LinearRegression()

# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)

# Print scores
print(____)
Modifier et exécuter le code