Validation croisée basée sur le temps

Pour finir, visualisons le comportement de l’itérateur de validation croisée pour séries temporelles dans scikit-learn. Utilisez cet objet pour parcourir vos données une dernière fois et afficher, à chaque itération, les données d’entraînement utilisées pour ajuster le modèle.

Une instance du modèle de régression linéaire model est disponible dans votre espace de travail. Les tableaux X et y (données d’entraînement) sont également disponibles.

Cet exercice fait partie du cours

Machine Learning for Time Series Data in Python

Afficher le cours

Instructions

Importez TimeSeriesSplit depuis sklearn.model_selection.
Instanciez un itérateur de validation croisée pour séries temporelles avec 10 partitions.
Parcourez les partitions de la validation croisée. À chaque itération, visualisez les valeurs des données d’entrée qui seraient utilisées pour entraîner le modèle à cette itération.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import TimeSeriesSplit
____

# Create time-series cross-validation object
cv = ____

# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
    # Plot the training data on each iteration, to see the behavior of the CV
    ax.plot(tr, ii + y[tr])

ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()

Modifier et exécuter le code