Puntuación global de validación

¡Ahora toca obtener el rendimiento real del modelo usando validación cruzada! ¿Cómo se comporta nuestro modelo de predicción de demanda por artículo y tienda?

Tu tarea es calcular el Mean Squared Error (MSE) para cada pliegue por separado y, después, combinar esos resultados en un solo número.

Para simplificar, se te proporciona la función get_fold_mse() que, para cada partición de validación cruzada, ajusta un modelo de Random Forest y devuelve una lista con las puntuaciones de MSE por pliegue. get_fold_mse() acepta dos argumentos: train y un objeto TimeSeriesSplit.

Este ejercicio forma parte del curso

Cómo ganar una competición de Kaggle con Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

from sklearn.model_selection import TimeSeriesSplit
import numpy as np

# Sort train data by date
train = train.sort_values('date')

# Initialize 3-fold time cross-validation
kf = ____(n_splits=____)

# Get MSE scores for each cross-validation split
mse_scores = get_fold_mse(train, kf)

print('Mean validation MSE: {:.5f}'.format(np.____(____)))

Editar y ejecutar código