Ajusta glmnet con un trainControl personalizado
Ahora que tienes un objeto trainControl personalizado, ajusta un modelo glmnet al conjunto de datos "don't overfit". Recuerda del vídeo que glmnet es una extensión del modelo de regresión lineal generalizada (o glm) que impone restricciones a la magnitud de los coeficientes para evitar el sobreajuste. Esto se conoce comúnmente como regresión "penalizada" y es una técnica muy útil en conjuntos de datos con muchas variables predictoras y pocos valores.
glmnet puede ajustar dos tipos de modelos penalizados, controlados por el parámetro alpha:
- Ridge regression (o
alpha = 0) - Lasso regression (o
alpha = 1)
Ahora ajustarás un modelo glmnet al conjunto de datos "don't overfit" usando los valores predeterminados que proporciona el paquete caret.
Este ejercicio forma parte del curso
Machine Learning con caret en R
Instrucciones del ejercicio
- Entrena un modelo
glmnetllamadomodelcon los datos deoverfit. Usa eltrainControlpersonalizado del ejercicio anterior (myControl). La variableyes la variable respuesta y todas las demás son variables explicativas. - Imprime el modelo en la consola.
- Usa la función
max()para encontrar el valor máximo de la métrica ROC que aparece enmodel[["results"]].
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Fit glmnet model: model
model <- train(
___,
___,
method = "glmnet",
trControl = ___
)
# Print model to console
# Print maximum ROC statistic