ComenzarEmpieza gratis

Validación cruzada 5 x 5-fold

Puedes hacer más que una sola iteración de validación cruzada. Repetir la validación cruzada te da una mejor estimación del error en el conjunto de prueba. También puedes repetir todo el procedimiento de validación cruzada. Esto lleva más tiempo, pero te proporciona muchos más conjuntos de datos fuera de muestra que analizar y evaluaciones mucho más precisas de cómo rinde el modelo.

Una de las grandes ventajas de la función train() en caret es lo fácil que es ejecutar modelos o métodos de validación cruzada muy distintos ajustando solo unos pocos argumentos de la llamada a la función. Por ejemplo, podrías repetir todo tu procedimiento de validación cruzada 5 veces para tener mayor confianza en tus estimaciones de la precisión fuera de muestra del modelo, por ejemplo:

trControl = trainControl(
  method = "repeatedcv", 
  number = 5,
  repeats = 5, 
  verboseIter = TRUE
)

Este ejercicio forma parte del curso

Machine Learning con caret en R

Ver curso

Instrucciones del ejercicio

  • Vuelve a ajustar el modelo de regresión lineal al conjunto de datos de viviendas Boston.
  • Usa 5 repeticiones de validación cruzada de 5 folds.
  • Imprime el modelo en la consola.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Fit lm model using 5 x 5-fold CV: model
model <- train(
  medv ~ ., 
  Boston,
  method = "lm",
  trControl = trainControl(
    method = "repeatedcv", 
    number = ___,
    repeats = ___, 
    verboseIter = TRUE
  )
)

# Print model to console
Editar y ejecutar código