Validasi silang 5-lipat
Dalam kursus ini, Anda akan menggunakan beragam himpunan data untuk mengeksplorasi fleksibilitas penuh paket caret. Di sini, Anda akan menggunakan himpunan data Boston housing yang terkenal, dengan tujuan memprediksi nilai median rumah di berbagai wilayah pinggiran Boston.
Anda dapat menggunakan kode yang sama persis seperti pada latihan sebelumnya, tetapi ubah himpunan data yang digunakan oleh model:
model <- train(
medv ~ .,
Boston, # <- baru!
method = "lm",
trControl = trainControl(
method = "cv",
number = 10,
verboseIter = TRUE
)
)
Selanjutnya, Anda dapat mengurangi jumlah lipatan validasi silang dari 10 menjadi 5 menggunakan argumen number pada argumen trainControl():
trControl = trainControl(
method = "cv",
number = 5,
verboseIter = TRUE
)
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Bentuk model
lm()pada himpunan data perumahanBoston, denganmedvsebagai variabel respons dan semua variabel lainnya sebagai variabel penjelas. - Gunakan validasi silang 5-lipat, bukan validasi silang 10-lipat.
- Cetak model ke konsol dan periksa hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit lm model using 5-fold CV: model
model <- train(
___,
___,
method = "lm",
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console