MulaiMulai sekarang secara gratis

Melatih glmnet dengan trainControl kustom

Sekarang setelah Anda memiliki objek trainControl kustom, latih model glmnet pada himpunan data "don't overfit". Ingat dari video bahwa glmnet adalah perluasan dari model regresi linear terumumkan (atau glm) yang memberikan batasan pada besaran koefisien untuk mencegah overfitting. Ini lebih dikenal sebagai pemodelan regresi "dipenalti" dan merupakan teknik yang sangat berguna pada himpunan data dengan banyak prediktor dan sedikit nilai.

glmnet mampu menyesuaikan dua jenis model dipenalti, yang dikendalikan oleh parameter alpha:

  • Ridge regression (atau alpha = 0)
  • Lasso regression (atau alpha = 1)

Sekarang Anda akan melatih model glmnet pada himpunan data "don't overfit" menggunakan nilai bawaan yang disediakan oleh paket caret.

Latihan ini adalah bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Petunjuk latihan

  • Latih model glmnet bernama model pada data overfit. Gunakan trainControl kustom dari latihan sebelumnya (myControl). Variabel y adalah variabel respons dan semua variabel lainnya adalah variabel penjelas.
  • Cetak model ke konsol.
  • Gunakan fungsi max() untuk mencari nilai maksimum statistik ROC yang terdapat di suatu tempat dalam model[["results"]].

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit glmnet model: model
model <- train(
  ___, 
  ___,
  method = "glmnet",
  trControl = ___
)

# Print model to console


# Print maximum ROC statistic
Edit dan Jalankan Kode