glmnet fitten met aangepaste trainControl
Nu je een aangepaste trainControl-object hebt, fit je een glmnet-model op de "don't overfit"-gegevensset. Denk aan de video: glmnet is een uitbreiding op het gegeneraliseerde lineaire regressiemodel (of glm) die beperkingen oplegt aan de grootte van de coëfficiënten om overfitting te voorkomen. Dit staat beter bekend als "gepenaliseerde" regressiemodellen en is een zeer nuttige techniek voor gegevenssets met veel voorspellers en weinig waarnemingen.
glmnet kan twee soorten gepenaliseerde modellen fitten, aangestuurd door de alpha-parameter:
- Ridge-regressie (of
alpha = 0) - Lasso-regressie (of
alpha = 1)
Je gaat nu een glmnet-model fitten op de "don't overfit"-gegevensset met de standaardinstellingen van het caret-pakket.
Deze oefening maakt deel uit van de cursus
Machine Learning met caret in R
Oefeninstructies
- Train een
glmnet-model met de naammodelop deoverfit-data. Gebruik de aangepastetrainControluit de vorige oefening (myControl). De variabeleyis de responsvariabele en alle andere variabelen zijn verklarende variabelen. - Print het model naar de console.
- Gebruik de functie
max()om het maximum van de ROC-statistiek te vinden die ergens inmodel[["results"]]zit.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit glmnet model: model
model <- train(
___,
___,
method = "glmnet",
trControl = ___
)
# Print model to console
# Print maximum ROC statistic