Validación cruzada basada en el tiempo

Por último, vamos a visualizar el comportamiento del itinerador de validación cruzada de series temporales en scikit-learn. Utiliza este objeto para iterar por tus datos una última vez, visualizando los datos de entrenamiento utilizados para ajustar el modelo en cada iteración.

Una instancia del objeto Regresión lineal model está disponible en tu espacio de trabajo. También están disponibles las matrices X y y (datos de entrenamiento).

Este ejercicio forma parte del curso

Machine learning para datos de series temporales en Python

Ver curso

Instrucciones de ejercicio

  • Importa TimeSeriesSplit desde sklearn.model_selection.
  • Instanciar un iterador de validación cruzada de series temporales con 10 divisiones.
  • Iterar a través de las divisiones de CV. En cada iteración, visualiza los valores de los datos de entrada que se utilizarían para entrenar el modelo de esa iteración.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import TimeSeriesSplit
____

# Create time-series cross-validation object
cv = ____

# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
    # Plot the training data on each iteration, to see the behavior of the CV
    ax.plot(tr, ii + y[tr])

ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()