MulaiMulai sekarang secara gratis

Coba pembagian 80/20

Sekarang himpunan data Anda sudah diacak, Anda dapat membagi 80% pertama sebagai himpunan pelatihan, dan 20% terakhir sebagai himpunan pengujian. Anda dapat melakukannya dengan memilih titik pembagian sekitar 80% dari keseluruhan data:

split <- round(nrow(mydata) * 0.80)

Lalu gunakan titik ini untuk memisahkan 80% pertama himpunan data sebagai himpunan pelatihan:

mydata[1:split, ]

Kemudian gunakan titik yang sama untuk menentukan himpunan pengujian:

mydata[(split + 1):nrow(mydata), ]

Latihan ini adalah bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Petunjuk latihan

  • Pilih indeks baris untuk melakukan pembagian sehingga titik pembagian berada kira-kira 80% dari keseluruhan himpunan data diamonds. Beri nama indeks ini split.
  • Buat himpunan pelatihan bernama train menggunakan indeks tersebut.
  • Buat himpunan pengujian bernama test menggunakan indeks tersebut.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Determine row to split on: split


# Create train


# Create test
Edit dan Jalankan Kode