Validación cruzada sin barajar
Ahora, vuelve a ejecutar el ajuste de tu modelo utilizando la validación cruzada en bloque (sin barajar todos los puntos de datos). En este caso, los puntos temporales vecinos se mantendrán próximos entre sí. ¿Cómo crees que serán las predicciones del modelo en cada bucle de validación cruzada?
Una instancia del objeto Regresión lineal model
está disponible en tu espacio de trabajo. También están disponibles las matrices X
y y
(datos de entrenamiento).
Este ejercicio forma parte del curso
Machine learning para datos de series temporales en Python
Instrucciones de ejercicio
- Instanciar otro objeto de validación cruzada, esta vez utilizando la validación cruzada KFold con 10 divisiones y sin barajar.
- Iterar a través de este objeto para ajustar un modelo utilizando los índices de entrenamiento y generar predicciones utilizando los índices de prueba.
- Visualiza las predicciones a través de las divisiones de CV utilizando la función de ayuda (
visualize_predictions()
) que hemos proporcionado.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create KFold cross-validation object
from sklearn.model_selection import KFold
cv = ____(n_splits=____, shuffle=____)
# Iterate through CV splits
results = []
for tr, tt in cv.split(X, y):
# Fit the model on training data
model.fit(____)
# Generate predictions on the test data and collect
prediction = model.predict(____)
results.append((prediction, tt))
# Custom function to quickly visualize predictions
visualize_predictions(results)