Buat lipatan
Membagi data hanya sekali menjadi himpunan latih dan uji memiliki ketidakpastian statistik — ada kemungkinan kecil bahwa himpunan uji Anda hanya berisi biji berkualitas tinggi, sementara semua biji berkualitas rendah ada di himpunan latih. Ini juga berarti Anda hanya dapat mengukur kinerja model sekali.
Cross-validation memberi Anda estimasi kinerja out-of-sample yang lebih andal tanpa jebakan statistik — teknik ini menilai model Anda secara lebih mendalam.
Dalam latihan ini, Anda akan membuat lipatan dari data latih chocolate_train, yang sudah dimuat sebelumnya.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Atur seed sebesar 20 agar dapat direproduksi.
- Buat 10 lipatan dari
chocolate_traindan simpan hasilnya sebagaichocolate_folds.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set seed for reproducibility
___
# Build 10 folds
chocolate_folds <- ___(___, v = ___)
print(chocolate_folds)