Melatih glmnet dengan trainControl kustom
Sekarang setelah Anda memiliki objek trainControl kustom, latih model glmnet pada himpunan data "don't overfit". Ingat dari video bahwa glmnet adalah perluasan dari model regresi linear terumumkan (atau glm) yang memberikan batasan pada besaran koefisien untuk mencegah overfitting. Ini lebih dikenal sebagai pemodelan regresi "dipenalti" dan merupakan teknik yang sangat berguna pada himpunan data dengan banyak prediktor dan sedikit nilai.
glmnet mampu menyesuaikan dua jenis model dipenalti, yang dikendalikan oleh parameter alpha:
- Ridge regression (atau
alpha = 0) - Lasso regression (atau
alpha = 1)
Sekarang Anda akan melatih model glmnet pada himpunan data "don't overfit" menggunakan nilai bawaan yang disediakan oleh paket caret.
Latihan ini merupakan bagian dari kursus
Machine Learning dengan caret di R
Instruksi latihan
- Latih model
glmnetbernamamodelpada dataoverfit. GunakantrainControlkustom dari latihan sebelumnya (myControl). Variabelyadalah variabel respons dan semua variabel lainnya adalah variabel penjelas. - Cetak model ke konsol.
- Gunakan fungsi
max()untuk mencari nilai maksimum statistik ROC yang terdapat di suatu tempat dalammodel[["results"]].
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Fit glmnet model: model
model <- train(
___,
___,
method = "glmnet",
trControl = ___
)
# Print model to console
# Print maximum ROC statistic