MulaiMulai sekarang secara gratis

Coba pembagian 60/40

Seperti yang Anda lihat di video, Anda akan bekerja dengan himpunan data Sonar di bab ini, menggunakan 60% data latih dan 40% data uji. Kita akan berlatih membuat pembagian train/test sekali lagi, untuk memastikan Anda benar-benar menguasainya. Ingat bahwa Anda dapat menggunakan fungsi sample() untuk mendapatkan permutasi acak dari indeks baris dalam sebuah himpunan data, untuk digunakan saat membuat pembagian train/test, misalnya:

n_obs <- nrow(my_data)
permuted_rows <- sample(n_obs)

Lalu gunakan indeks baris tersebut untuk mengacak ulang himpunan data secara acak, misalnya:

my_data <- my_data[permuted_rows, ]

Setelah himpunan data Anda diacak secara acak, Anda dapat memisahkan 60% pertama sebagai data latih dan 40% terakhir sebagai data uji.

Latihan ini adalah bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Petunjuk latihan

  • Dapatkan jumlah observasi (baris) dalam Sonar, simpan ke n_obs.
  • Acak indeks baris Sonar dan simpan hasilnya ke permuted_rows.
  • Gunakan permuted_rows untuk mengacak urutan baris Sonar secara acak, simpan sebagai Sonar_shuffled.
  • Tentukan baris yang tepat untuk melakukan pembagian 60/40. Simpan nomor baris ini sebagai split.
  • Simpan 60% pertama dari Sonar_shuffled sebagai data latih.
  • Simpan 40% terakhir dari Sonar_shuffled sebagai data uji.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Get the number of observations


# Shuffle row indices: permuted_rows


# Randomly order data: Sonar


# Identify row to split on: split
split <- round(n_obs * ___)

# Create train


# Create test
Edit dan Jalankan Kode