MulaiMulai sekarang secara gratis

Pisahkan menjadi train dan test

Sekarang kita sudah memiliki sebuah dataframe, kita dapat menerapkan teknik standar untuk pemodelan. Dalam latihan ini, Anda akan membagi data menjadi himpunan latih dan himpunan uji.

Latihan ini adalah bagian dari kursus

Analitik Prediktif menggunakan Data Berjejaring di R

Lihat Kursus

Petunjuk latihan

  • Untuk memastikan hasil Anda dapat direproduksi, atur seed ke 7 dengan menggunakan set.seed().
  • Gunakan fungsi sample() untuk mengambil sampel dua pertiga angka dari urutan dalam rentang jumlah total baris di studentnetworkdata. Beri nama vektor ini index_train.
  • Buat himpunan latih dengan menyertakan baris studentnetworkdata yang tersimpan dalam index_train dan beri nama training_set.
  • Buat himpunan uji dengan mengecualikan baris studentnetworkdata yang tersimpan dalam index_train dan beri nama test_set.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Set the seed
set.seed(___)

# Creat the index vector
index_train <- sample(1:nrow(___), 2 / 3 * nrow(___))

# Make the training set
training_set <- ___[index_train,]

# Make the test set
___ <- ___[-index_train,]
Edit dan Jalankan Kode