Puntuación global de validación
¡Ahora toca obtener el rendimiento real del modelo usando validación cruzada! ¿Cómo se comporta nuestro modelo de predicción de demanda por artículo y tienda?
Tu tarea es calcular el Mean Squared Error (MSE) para cada pliegue por separado y, después, combinar esos resultados en un solo número.
Para simplificar, se te proporciona la función get_fold_mse() que, para cada partición de validación cruzada, ajusta un modelo de Random Forest y devuelve una lista con las puntuaciones de MSE por pliegue. get_fold_mse() acepta dos argumentos: train y un objeto TimeSeriesSplit.
Este ejercicio forma parte del curso
Cómo ganar una competición de Kaggle con Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
from sklearn.model_selection import TimeSeriesSplit
import numpy as np
# Sort train data by date
train = train.sort_values('date')
# Initialize 3-fold time cross-validation
kf = ____(n_splits=____)
# Get MSE scores for each cross-validation split
mse_scores = get_fold_mse(train, kf)
print('Mean validation MSE: {:.5f}'.format(np.____(____)))