Özel trainControl ile glmnet'i uygula
Artık özel bir trainControl nesnen olduğuna göre, "don't overfit" veri kümesine bir glmnet modeli uygula. Videodan hatırlayacağın üzere glmnet, aşırı uyumu önlemek için katsayıların büyüklüğüne kısıtlar getiren genelleştirilmiş doğrusal regresyon modelinin (glm) bir uzantısıdır. Bu yaklaşım daha yaygın olarak "cezalandırmalı" regresyon modelleme olarak bilinir ve çok sayıda yordayıcı, az sayıda gözlem içeren veri kümelerinde oldukça kullanışlıdır.
glmnet, alpha parametresiyle kontrol edilen iki farklı türde cezalandırmalı modeli uydurabilir:
- Ridge regresyonu (veya
alpha = 0) - Lasso regresyonu (veya
alpha = 1)
Şimdi caret paketinin varsayılanlarını kullanarak "don't overfit" veri kümesine bir glmnet modeli uygulayacaksın.
Bu egzersiz, kursun bir parçasıdır
R ile caret kullanarak Machine Learning
Egzersiz talimatları
overfitverisi üzerindemodeladlı birglmnetmodeli eğit. Önceki egzersizdeki özeltrainControl'ü (myControl) kullan. Bağımlı değişkeny, diğer tüm değişkenler açıklayıcı değişkenlerdir.- Modeli konsola yazdır.
model[["results"]]içinde yer alan ROC istatistiğinin maksimumunu bulmak içinmax()fonksiyonunu kullan.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Fit glmnet model: model
model <- train(
___,
___,
method = "glmnet",
trControl = ___
)
# Print model to console
# Print maximum ROC statistic