Crea las particiones
Dividir los datos una sola vez en conjuntos de entrenamiento y prueba tiene inseguridades estadísticas: existe una pequeña posibilidad de que tu conjunto de prueba contenga solo habas con alta valoración, mientras que todas las de baja valoración queden en el conjunto de entrenamiento. También implica que solo podrás medir el rendimiento de tu modelo una vez.
La validación cruzada te da una estimación más robusta de tu rendimiento fuera de muestra sin esos escollos estadísticos: evalúa tu modelo de manera más profunda.
En este ejercicio, crearás particiones (folds) de tus datos de entrenamiento chocolate_train, que ya están precargados.
Este ejercicio forma parte del curso
Machine Learning con modelos basados en árboles en R
Instrucciones del ejercicio
- Establece una semilla de 20 para asegurar la reproducibilidad.
- Crea 10 particiones de
chocolate_trainy guarda el resultado enchocolate_folds.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set seed for reproducibility
___
# Build 10 folds
chocolate_folds <- ___(___, v = ___)
print(chocolate_folds)