ComeçarComece de graça

Validação cruzada baseada em tempo

Para finalizar, vamos visualizar o comportamento do iterador de validação cruzada para séries temporais no scikit-learn. Use esse objeto para percorrer seus dados mais uma vez, visualizando os dados de treino usados para ajustar o modelo em cada iteração.

Uma instância do objeto model de regressão linear está disponível no seu workspace. Além disso, os arrays X e y (dados de treino) também estão disponíveis.

Este exercício faz parte do curso

Machine Learning para dados de séries temporais em Python

Ver curso

Instruções do exercício

  • Importe TimeSeriesSplit de sklearn.model_selection.
  • Instancie um iterador de validação cruzada para séries temporais com 10 divisões.
  • Faça a iteração pelos splits da validação cruzada. Em cada iteração, visualize os valores dos dados de entrada que seriam usados para treinar o modelo naquela iteração.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import TimeSeriesSplit
____

# Create time-series cross-validation object
cv = ____

# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
    # Plot the training data on each iteration, to see the behavior of the CV
    ax.plot(tr, ii + y[tr])

ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()
Editar e executar o código