EmpezarEmpieza gratis

Puntuación global de validación

¡Ahora toca obtener el rendimiento real del modelo usando validación cruzada! ¿Cómo se comporta nuestro modelo de predicción de demanda por artículo y tienda?

Tu tarea es calcular el Mean Squared Error (MSE) para cada pliegue por separado y, después, combinar esos resultados en un solo número.

Para simplificar, se te proporciona la función get_fold_mse() que, para cada partición de validación cruzada, ajusta un modelo de Random Forest y devuelve una lista con las puntuaciones de MSE por pliegue. get_fold_mse() acepta dos argumentos: train y un objeto TimeSeriesSplit.

Este ejercicio forma parte del curso

Cómo ganar una competición de Kaggle con Python

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

from sklearn.model_selection import TimeSeriesSplit
import numpy as np

# Sort train data by date
train = train.sort_values('date')

# Initialize 3-fold time cross-validation
kf = ____(n_splits=____)

# Get MSE scores for each cross-validation split
mse_scores = get_fold_mse(train, kf)

print('Mean validation MSE: {:.5f}'.format(np.____(____)))
Editar y ejecutar código