Coba pembagian 60/40
Seperti yang Anda lihat di video, Anda akan bekerja dengan himpunan data Sonar di bab ini, menggunakan 60% data latih dan 40% data uji. Kita akan berlatih membuat pembagian train/test sekali lagi, untuk memastikan Anda benar-benar menguasainya. Ingat bahwa Anda dapat menggunakan fungsi sample() untuk mendapatkan permutasi acak dari indeks baris dalam sebuah himpunan data, untuk digunakan saat membuat pembagian train/test, misalnya:
n_obs <- nrow(my_data)
permuted_rows <- sample(n_obs)
Lalu gunakan indeks baris tersebut untuk mengacak ulang himpunan data secara acak, misalnya:
my_data <- my_data[permuted_rows, ]
Setelah himpunan data Anda diacak secara acak, Anda dapat memisahkan 60% pertama sebagai data latih dan 40% terakhir sebagai data uji.
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Dapatkan jumlah observasi (baris) dalam
Sonar, simpan ken_obs. - Acak indeks baris
Sonardan simpan hasilnya kepermuted_rows. - Gunakan
permuted_rowsuntuk mengacak urutan barisSonarsecara acak, simpan sebagaiSonar_shuffled. - Tentukan baris yang tepat untuk melakukan pembagian 60/40. Simpan nomor baris ini sebagai
split. - Simpan 60% pertama dari
Sonar_shuffledsebagai data latih. - Simpan 40% terakhir dari
Sonar_shuffledsebagai data uji.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the number of observations
# Shuffle row indices: permuted_rows
# Randomly order data: Sonar
# Identify row to split on: split
split <- round(n_obs * ___)
# Create train
# Create test