ComenzarEmpieza gratis

Crea las particiones

Dividir los datos una sola vez en conjuntos de entrenamiento y prueba tiene inseguridades estadísticas: existe una pequeña posibilidad de que tu conjunto de prueba contenga solo habas con alta valoración, mientras que todas las de baja valoración queden en el conjunto de entrenamiento. También implica que solo podrás medir el rendimiento de tu modelo una vez.

La validación cruzada te da una estimación más robusta de tu rendimiento fuera de muestra sin esos escollos estadísticos: evalúa tu modelo de manera más profunda.

En este ejercicio, crearás particiones (folds) de tus datos de entrenamiento chocolate_train, que ya están precargados.

Este ejercicio forma parte del curso

Machine Learning con modelos basados en árboles en R

Ver curso

Instrucciones del ejercicio

  • Establece una semilla de 20 para asegurar la reproducibilidad.
  • Crea 10 particiones de chocolate_train y guarda el resultado en chocolate_folds.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set seed for reproducibility
___

# Build 10 folds
chocolate_folds <- ___(___, v = ___)

print(chocolate_folds)
Editar y ejecutar código