Ajuste glmnet com trainControl personalizado
Agora que você tem um objeto trainControl personalizado, ajuste um modelo glmnet ao conjunto de dados "don't overfit". Lembre do vídeo que glmnet é uma extensão do modelo de regressão linear generalizada (ou glm) que impõe restrições ao tamanho dos coeficientes para evitar overfitting. Isso é mais conhecido como modelagem de regressão "penalizada" e é uma técnica muito útil em conjuntos de dados com muitos preditores e poucos valores.
O glmnet é capaz de ajustar dois tipos diferentes de modelos penalizados, controlados pelo parâmetro alpha:
- Regressão Ridge (ou
alpha = 0) - Regressão Lasso (ou
alpha = 1)
Agora você vai ajustar um modelo glmnet ao conjunto de dados "don't overfit" usando os padrões fornecidos pelo pacote caret.
Este exercício faz parte do curso
Machine Learning com caret em R
Instruções do exercício
- Treine um modelo
glmnetchamadomodelcom os dadosoverfit. Use otrainControlpersonalizado do exercício anterior (myControl). A variávelyé a variável resposta e todas as outras são variáveis explicativas. - Imprima o modelo no console.
- Use a função
max()para encontrar o máximo da métrica ROC contida em algum lugar demodel[["results"]].
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit glmnet model: model
model <- train(
___,
___,
method = "glmnet",
trControl = ___
)
# Print model to console
# Print maximum ROC statistic