Validação cruzada baseada em tempo
Por fim, vamos visualizar o comportamento do iterador de validação cruzada de séries temporais no scikit-learn. Use esse objeto para iterar pelos dados uma última vez, visualizando os dados de treinamento usados para ajustar o modelo em cada iteração.
Uma instância do objeto Linear regression model
está disponível em seu espaço de trabalho. Além disso, as matrizes X
e y
(dados de treinamento) também estão disponíveis.
Este exercício faz parte do curso
Aprendizado de máquina para dados de séries temporais em Python
Instruções de exercício
- Importar
TimeSeriesSplit
desklearn.model_selection
. - Instanciar um iterador de validação cruzada de série temporal com 10 divisões.
- Iterar através de CV splits. Em cada iteração, visualize os valores dos dados de entrada que seriam usados para treinar o modelo para essa iteração.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import TimeSeriesSplit
____
# Create time-series cross-validation object
cv = ____
# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
# Plot the training data on each iteration, to see the behavior of the CV
ax.plot(tr, ii + y[tr])
ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()