Buat rencana cross validation
Ada beberapa cara untuk menerapkan rencana n-fold cross validation. Pada latihan ini, Anda akan
membuat rencana tersebut menggunakan vtreat::kWayCrossValidation(), lalu meninjaunya.
kWayCrossValidation() membuat rencana cross validation dengan pemanggilan berikut:
splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)
Di mana nRows adalah jumlah baris data yang akan dipecah, dan nSplits adalah jumlah fold cross-validation yang diinginkan.
Secara ketat, dframe dan y tidak digunakan oleh kWayCrossValidation; keduanya ada untuk kompatibilitas dengan fungsi pemartisian data vtreat lainnya. Anda dapat mengatur keduanya menjadi NULL.
splitPlan yang dihasilkan adalah sebuah list dengan nSplits elemen; setiap elemen berisi dua vektor:
train: indeksdframeyang akan membentuk himpunan latihapp: indeksdframeyang akan membentuk himpunan uji (atau aplikasi)
Pada latihan ini, Anda akan membuat rencana cross-validation 3-fold untuk himpunan data mpg.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Muat paket
vtreat. - Dapatkan jumlah baris dalam
mpgdan simpan ke variabelnRows. - Panggil
kWayCrossValidationuntuk membuat rencana cross validation 3-fold dan simpan ke variabelsplitPlan.- Anda dapat mengatur dua argumen terakhir fungsi tersebut menjadi
NULL.
- Anda dapat mengatur dua argumen terakhir fungsi tersebut menjadi
- Panggil
str()untuk meninjau struktursplitPlan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the package vtreat
___
# mpg is available
summary(mpg)
# Get the number of rows in mpg
nRows <- ___
# Implement the 3-fold cross-fold plan with vtreat
splitPlan <- ___
# Examine the split plan
___