Coba pembagian 80/20
Sekarang himpunan data Anda sudah diacak, Anda dapat membagi 80% pertama sebagai himpunan pelatihan, dan 20% terakhir sebagai himpunan pengujian. Anda dapat melakukannya dengan memilih titik pembagian sekitar 80% dari keseluruhan data:
split <- round(nrow(mydata) * 0.80)
Lalu gunakan titik ini untuk memisahkan 80% pertama himpunan data sebagai himpunan pelatihan:
mydata[1:split, ]
Kemudian gunakan titik yang sama untuk menentukan himpunan pengujian:
mydata[(split + 1):nrow(mydata), ]
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Pilih indeks baris untuk melakukan pembagian sehingga titik pembagian berada kira-kira 80% dari keseluruhan himpunan data
diamonds. Beri nama indeks inisplit. - Buat himpunan pelatihan bernama
trainmenggunakan indeks tersebut. - Buat himpunan pengujian bernama
testmenggunakan indeks tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Determine row to split on: split
# Create train
# Create test