Melatih glmnet dengan trainControl kustom
Sekarang setelah Anda memiliki objek trainControl kustom, latih model glmnet pada himpunan data "don't overfit". Ingat dari video bahwa glmnet adalah perluasan dari model regresi linear terumumkan (atau glm) yang memberikan batasan pada besaran koefisien untuk mencegah overfitting. Ini lebih dikenal sebagai pemodelan regresi "dipenalti" dan merupakan teknik yang sangat berguna pada himpunan data dengan banyak prediktor dan sedikit nilai.
glmnet mampu menyesuaikan dua jenis model dipenalti, yang dikendalikan oleh parameter alpha:
- Ridge regression (atau
alpha = 0) - Lasso regression (atau
alpha = 1)
Sekarang Anda akan melatih model glmnet pada himpunan data "don't overfit" menggunakan nilai bawaan yang disediakan oleh paket caret.
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Latih model
glmnetbernamamodelpada dataoverfit. GunakantrainControlkustom dari latihan sebelumnya (myControl). Variabelyadalah variabel respons dan semua variabel lainnya adalah variabel penjelas. - Cetak model ke konsol.
- Gunakan fungsi
max()untuk mencari nilai maksimum statistik ROC yang terdapat di suatu tempat dalammodel[["results"]].
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit glmnet model: model
model <- train(
___,
___,
method = "glmnet",
trControl = ___
)
# Print model to console
# Print maximum ROC statistic