Buat indeks latih/uji khusus
Seperti yang Anda lihat di video, pada bab ini Anda akan berfokus pada himpunan data dunia nyata yang merangkum semua konsep yang dibahas pada bab-bab sebelumnya.
Himpunan data churn memuat data beragam pelanggan perusahaan telekomunikasi, dan tantangan pemodelannya adalah memprediksi pelanggan mana yang akan membatalkan layanan mereka (churn).
Di bab ini, Anda akan mengeksplorasi dua jenis model prediktif: glmnet dan rf, sehingga langkah pertama adalah membuat objek trainControl yang dapat digunakan ulang untuk membandingkan keduanya secara andal.
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
churn_x dan churn_y telah dimuat di ruang kerja Anda.
- Gunakan
createFolds()untuk membuat 5 lipatan CV padachurn_y, variabel target Anda untuk latihan ini. - Teruskan lipatan tersebut ke
trainControl()untuk membuattrainControlyang dapat digunakan ulang untuk membandingkan model.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)
# Create reusable trainControl object: myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = ___
)