Punteggio di validazione complessivo

È il momento di valutare davvero le prestazioni del modello usando la cross-validation! Come si comporta il nostro modello di previsione della domanda per articolo/negozio?

Il tuo compito è prendere il Mean Squared Error (MSE) per ciascun fold separatamente e poi combinare questi risultati in un unico numero.

Per semplicità, ti viene fornita la funzione get_fold_mse() che, per ogni split di cross-validation, addestra un modello Random Forest e restituisce un elenco di punteggi MSE per fold. get_fold_mse() accetta due argomenti: train e un oggetto TimeSeriesSplit.

Questo esercizio fa parte del corso

Vincere una competizione Kaggle con Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

from sklearn.model_selection import TimeSeriesSplit
import numpy as np

# Sort train data by date
train = train.sort_values('date')

# Initialize 3-fold time cross-validation
kf = ____(n_splits=____)

# Get MSE scores for each cross-validation split
mse_scores = get_fold_mse(train, kf)

print('Mean validation MSE: {:.5f}'.format(np.____(____)))

Modifica ed esegui il codice