ComeçarComece de graça

Validação cruzada sem embaralhamento

Agora, execute novamente o ajuste do seu modelo usando validação cruzada em blocos (sem embaralhar todos os dados). Nesse caso, pontos de tempo vizinhos serão mantidos próximos uns dos outros. Como você acha que as previsões do modelo vão ficar em cada loop de validação cruzada?

Uma instância do objeto de regressão linear model está disponível no seu workspace. Além disso, os arrays X e y (dados de treino) também estão disponíveis.

Este exercício faz parte do curso

Machine Learning para dados de séries temporais em Python

Ver curso

Instruções do exercício

  • Instancie outro objeto de validação cruzada, desta vez usando KFold com 10 divisões e sem embaralhamento.
  • Faça a iteração por esse objeto para ajustar um modelo usando os índices de treino e gerar previsões usando os índices de teste.
  • Visualize as previsões ao longo dos splits de CV usando a função auxiliar (visualize_predictions()) que fornecemos.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create KFold cross-validation object
from sklearn.model_selection import KFold
cv = ____(n_splits=____, shuffle=____)

# Iterate through CV splits
results = []
for tr, tt in cv.split(X, y):
    # Fit the model on training data
    model.fit(____)
    
    # Generate predictions on the test data and collect
    prediction = model.predict(____)
    results.append((prediction, tt))
    
# Custom function to quickly visualize predictions
visualize_predictions(results)
Editar e executar o código