MulaiMulai sekarang secara gratis

Buat rencana cross validation

Ada beberapa cara untuk menerapkan rencana n-fold cross validation. Pada latihan ini, Anda akan membuat rencana tersebut menggunakan vtreat::kWayCrossValidation(), lalu meninjaunya.

kWayCrossValidation() membuat rencana cross validation dengan pemanggilan berikut:

splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)

Di mana nRows adalah jumlah baris data yang akan dipecah, dan nSplits adalah jumlah fold cross-validation yang diinginkan.

Secara ketat, dframe dan y tidak digunakan oleh kWayCrossValidation; keduanya ada untuk kompatibilitas dengan fungsi pemartisian data vtreat lainnya. Anda dapat mengatur keduanya menjadi NULL.

splitPlan yang dihasilkan adalah sebuah list dengan nSplits elemen; setiap elemen berisi dua vektor:

  • train: indeks dframe yang akan membentuk himpunan latih
  • app: indeks dframe yang akan membentuk himpunan uji (atau aplikasi)

Pada latihan ini, Anda akan membuat rencana cross-validation 3-fold untuk himpunan data mpg.

Latihan ini adalah bagian dari kursus

Supervised Learning di R: Regresi

Lihat Kursus

Petunjuk latihan

  • Muat paket vtreat.
  • Dapatkan jumlah baris dalam mpg dan simpan ke variabel nRows.
  • Panggil kWayCrossValidation untuk membuat rencana cross validation 3-fold dan simpan ke variabel splitPlan.
    • Anda dapat mengatur dua argumen terakhir fungsi tersebut menjadi NULL.
  • Panggil str() untuk meninjau struktur splitPlan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load the package vtreat
___

# mpg is available
summary(mpg)

# Get the number of rows in mpg
nRows <- ___

# Implement the 3-fold cross-fold plan with vtreat
splitPlan <- ___

# Examine the split plan
___
Edit dan Jalankan Kode