MulaiMulai sekarang secara gratis

Validasi silang 5-lipat

Dalam kursus ini, Anda akan menggunakan beragam himpunan data untuk mengeksplorasi fleksibilitas penuh paket caret. Di sini, Anda akan menggunakan himpunan data Boston housing yang terkenal, dengan tujuan memprediksi nilai median rumah di berbagai wilayah pinggiran Boston.

Anda dapat menggunakan kode yang sama persis seperti pada latihan sebelumnya, tetapi ubah himpunan data yang digunakan oleh model:

model <- train(
  medv ~ ., 
  Boston, # <- baru!
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = 10,
    verboseIter = TRUE
  )
)

Selanjutnya, Anda dapat mengurangi jumlah lipatan validasi silang dari 10 menjadi 5 menggunakan argumen number pada argumen trainControl():

trControl = trainControl(
  method = "cv", 
  number = 5,
  verboseIter = TRUE
)

Latihan ini adalah bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Petunjuk latihan

  • Bentuk model lm() pada himpunan data perumahan Boston, dengan medv sebagai variabel respons dan semua variabel lainnya sebagai variabel penjelas.
  • Gunakan validasi silang 5-lipat, bukan validasi silang 10-lipat.
  • Cetak model ke konsol dan periksa hasilnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit lm model using 5-fold CV: model
model <- train(
  ___, 
  ___,
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = ___,
    verboseIter = TRUE
  )
)

# Print model to console
Edit dan Jalankan Kode