Validação cruzada baseada em tempo
Para finalizar, vamos visualizar o comportamento do iterador de validação cruzada para séries temporais no scikit-learn. Use esse objeto para percorrer seus dados mais uma vez, visualizando os dados de treino usados para ajustar o modelo em cada iteração.
Uma instância do objeto model de regressão linear está disponível no seu workspace. Além disso, os arrays X e y (dados de treino) também estão disponíveis.
Este exercício faz parte do curso
Machine Learning para dados de séries temporais em Python
Instruções do exercício
- Importe
TimeSeriesSplitdesklearn.model_selection. - Instancie um iterador de validação cruzada para séries temporais com 10 divisões.
- Faça a iteração pelos splits da validação cruzada. Em cada iteração, visualize os valores dos dados de entrada que seriam usados para treinar o modelo naquela iteração.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import TimeSeriesSplit
____
# Create time-series cross-validation object
cv = ____
# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
# Plot the training data on each iteration, to see the behavior of the CV
ax.plot(tr, ii + y[tr])
ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()