Validação cruzada sem embaralhamento
Agora, execute novamente o ajuste do modelo usando a validação cruzada em bloco (sem embaralhar todos os pontos de dados). Nesse caso, os pontos de tempo vizinhos serão mantidos próximos uns dos outros. Como você acha que serão as previsões do modelo em cada loop de validação cruzada?
Uma instância do objeto Linear regression model
está disponível em seu espaço de trabalho. Além disso, as matrizes X
e y
(dados de treinamento) também estão disponíveis.
Este exercício faz parte do curso
Aprendizado de máquina para dados de séries temporais em Python
Instruções de exercício
- Instanciar outro objeto de validação cruzada, desta vez usando KFvalidação cruzada antiga com 10 divisões e sem embaralhamento.
- Iterar por esse objeto para ajustar um modelo usando os índices de treinamento e gerar previsões usando os índices de teste.
- Visualize as previsões em CV divisões usando a função auxiliar (
visualize_predictions()
) que fornecemos.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create KFold cross-validation object
from sklearn.model_selection import KFold
cv = ____(n_splits=____, shuffle=____)
# Iterate through CV splits
results = []
for tr, tt in cv.split(X, y):
# Fit the model on training data
model.fit(____)
# Generate predictions on the test data and collect
prediction = model.predict(____)
results.append((prediction, tt))
# Custom function to quickly visualize predictions
visualize_predictions(results)