Punteggio di validazione complessivo
È il momento di valutare davvero le prestazioni del modello usando la cross-validation! Come si comporta il nostro modello di previsione della domanda per articolo/negozio?
Il tuo compito è prendere il Mean Squared Error (MSE) per ciascun fold separatamente e poi combinare questi risultati in un unico numero.
Per semplicità, ti viene fornita la funzione get_fold_mse() che, per ogni split di cross-validation, addestra un modello Random Forest e restituisce un elenco di punteggi MSE per fold. get_fold_mse() accetta due argomenti: train e un oggetto TimeSeriesSplit.
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
from sklearn.model_selection import TimeSeriesSplit
import numpy as np
# Sort train data by date
train = train.sort_values('date')
# Initialize 3-fold time cross-validation
kf = ____(n_splits=____)
# Get MSE scores for each cross-validation split
mse_scores = get_fold_mse(train, kf)
print('Mean validation MSE: {:.5f}'.format(np.____(____)))