Validation croisée basée sur le temps
Pour finir, visualisons le comportement de l’itérateur de validation croisée pour séries temporelles dans scikit-learn. Utilisez cet objet pour parcourir vos données une dernière fois et afficher, à chaque itération, les données d’entraînement utilisées pour ajuster le modèle.
Une instance du modèle de régression linéaire model est disponible dans votre espace de travail. Les tableaux X et y (données d’entraînement) sont également disponibles.
Cet exercice fait partie du cours
Machine Learning for Time Series Data in Python
Instructions
- Importez
TimeSeriesSplitdepuissklearn.model_selection. - Instanciez un itérateur de validation croisée pour séries temporelles avec 10 partitions.
- Parcourez les partitions de la validation croisée. À chaque itération, visualisez les valeurs des données d’entrée qui seraient utilisées pour entraîner le modèle à cette itération.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import TimeSeriesSplit
____
# Create time-series cross-validation object
cv = ____
# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
# Plot the training data on each iteration, to see the behavior of the CV
ax.plot(tr, ii + y[tr])
ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()