Cross-validation 5 x 5-fold
Anda dapat melakukan lebih dari satu iterasi cross-validation. Repeated cross-validation memberikan perkiraan yang lebih baik terhadap galat himpunan uji. Anda juga dapat mengulang seluruh prosedur cross-validation. Ini memerlukan waktu lebih lama, tetapi memberi Anda jauh lebih banyak himpunan data out-of-sample untuk ditinjau dan penilaian yang jauh lebih presisi tentang seberapa baik kinerja model.
Salah satu hal hebat dari fungsi train() di caret adalah betapa mudahnya menjalankan model yang sangat berbeda atau metode cross-validation hanya dengan menyesuaikan beberapa argumen sederhana pada pemanggilan fungsi. Sebagai contoh, Anda dapat mengulang seluruh prosedur cross-validation sebanyak 5 kali untuk meningkatkan keyakinan pada estimasi akurasi out-of-sample model, misalnya:
trControl = trainControl(
method = "repeatedcv",
number = 5,
repeats = 5,
verboseIter = TRUE
)
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Pasang ulang model regresi linear pada himpunan data perumahan
Boston. - Gunakan 5 pengulangan dari 5-fold cross-validation.
- Cetak model ke konsol.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit lm model using 5 x 5-fold CV: model
model <- train(
medv ~ .,
Boston,
method = "lm",
trControl = trainControl(
method = "repeatedcv",
number = ___,
repeats = ___,
verboseIter = TRUE
)
)
# Print model to console