Validación cruzada basada en el tiempo
Para terminar, vamos a visualizar el comportamiento del iterador de validación cruzada para series temporales en scikit-learn. Usa este objeto para recorrer tus datos por última vez y visualizar los datos de entrenamiento usados para ajustar el modelo en cada iteración.
Tienes disponible en tu espacio de trabajo una instancia del objeto model de regresión lineal. También están disponibles los arrays X y y (datos de entrenamiento).
Este ejercicio forma parte del curso
Machine Learning para datos de series temporales en Python
Instrucciones del ejercicio
- Importa
TimeSeriesSplitdesklearn.model_selection. - Instancia un iterador de validación cruzada para series temporales con 10 particiones.
- Recorre las particiones de la validación cruzada. En cada iteración, visualiza los valores de los datos de entrada que se usarían para entrenar el modelo en esa iteración.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import TimeSeriesSplit
____
# Create time-series cross-validation object
cv = ____
# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
# Plot the training data on each iteration, to see the behavior of the CV
ax.plot(tr, ii + y[tr])
ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()