Özel trainControl ile glmnet'i uygula
Artık özel bir trainControl nesnen olduğuna göre, "don't overfit" veri kümesine bir glmnet modeli uygula. Videodan hatırlayacağın üzere glmnet, aşırı uyumu önlemek için katsayıların büyüklüğüne kısıtlar getiren genelleştirilmiş doğrusal regresyon modelinin (glm) bir uzantısıdır. Bu yaklaşım daha yaygın olarak "cezalandırmalı" regresyon modelleme olarak bilinir ve çok sayıda yordayıcı, az sayıda gözlem içeren veri kümelerinde oldukça kullanışlıdır.
glmnet, alpha parametresiyle kontrol edilen iki farklı türde cezalandırmalı modeli uydurabilir:
- Ridge regresyonu (veya
alpha = 0) - Lasso regresyonu (veya
alpha = 1)
Şimdi caret paketinin varsayılanlarını kullanarak "don't overfit" veri kümesine bir glmnet modeli uygulayacaksın.
Bu egzersiz
R ile caret kullanarak Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
overfitverisi üzerindemodeladlı birglmnetmodeli eğit. Önceki egzersizdeki özeltrainControl'ü (myControl) kullan. Bağımlı değişkeny, diğer tüm değişkenler açıklayıcı değişkenlerdir.- Modeli konsola yazdır.
model[["results"]]içinde yer alan ROC istatistiğinin maksimumunu bulmak içinmax()fonksiyonunu kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fit glmnet model: model
model <- train(
___,
___,
method = "glmnet",
trControl = ___
)
# Print model to console
# Print maximum ROC statistic