glmnet fitten met aangepaste trainControl

Nu je een aangepaste trainControl-object hebt, fit je een glmnet-model op de "don't overfit"-gegevensset. Denk aan de video: glmnet is een uitbreiding op het gegeneraliseerde lineaire regressiemodel (of glm) die beperkingen oplegt aan de grootte van de coëfficiënten om overfitting te voorkomen. Dit staat beter bekend als "gepenaliseerde" regressiemodellen en is een zeer nuttige techniek voor gegevenssets met veel voorspellers en weinig waarnemingen.

glmnet kan twee soorten gepenaliseerde modellen fitten, aangestuurd door de alpha-parameter:

Ridge-regressie (of alpha = 0)
Lasso-regressie (of alpha = 1)

Je gaat nu een glmnet-model fitten op de "don't overfit"-gegevensset met de standaardinstellingen van het caret-pakket.

Deze oefening maakt deel uit van de cursus

Machine Learning met caret in R

Bekijk cursus

Oefeninstructies

Train een glmnet-model met de naam model op de overfit-data. Gebruik de aangepaste trainControl uit de vorige oefening (myControl). De variabele y is de responsvariabele en alle andere variabelen zijn verklarende variabelen.
Print het model naar de console.
Gebruik de functie max() om het maximum van de ROC-statistiek te vinden die ergens in model[["results"]] zit.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Fit glmnet model: model
model <- train(
  ___, 
  ___,
  method = "glmnet",
  trControl = ___
)

# Print model to console


# Print maximum ROC statistic

Code bewerken en uitvoeren