ComeçarComece gratuitamente

Validação cruzada baseada em tempo

Por fim, vamos visualizar o comportamento do iterador de validação cruzada de séries temporais no scikit-learn. Use esse objeto para iterar pelos dados uma última vez, visualizando os dados de treinamento usados para ajustar o modelo em cada iteração.

Uma instância do objeto Linear regression model está disponível em seu espaço de trabalho. Além disso, as matrizes X e y (dados de treinamento) também estão disponíveis.

Este exercício faz parte do curso

Aprendizado de máquina para dados de séries temporais em Python

Ver Curso

Instruções de exercício

  • Importar TimeSeriesSplit de sklearn.model_selection.
  • Instanciar um iterador de validação cruzada de série temporal com 10 divisões.
  • Iterar através de CV splits. Em cada iteração, visualize os valores dos dados de entrada que seriam usados para treinar o modelo para essa iteração.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import TimeSeriesSplit
____

# Create time-series cross-validation object
cv = ____

# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
    # Plot the training data on each iteration, to see the behavior of the CV
    ax.plot(tr, ii + y[tr])

ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()
Editar e executar código