Pisahkan menjadi train dan test
Sekarang kita sudah memiliki sebuah dataframe, kita dapat menerapkan teknik standar untuk pemodelan. Dalam latihan ini, Anda akan membagi data menjadi himpunan latih dan himpunan uji.
Latihan ini adalah bagian dari kursus
Analitik Prediktif menggunakan Data Berjejaring di R
Petunjuk latihan
- Untuk memastikan hasil Anda dapat direproduksi, atur seed ke 7 dengan menggunakan
set.seed(). - Gunakan fungsi
sample()untuk mengambil sampel dua pertiga angka dari urutan dalam rentang jumlah total baris distudentnetworkdata. Beri nama vektor iniindex_train. - Buat himpunan latih dengan menyertakan baris
studentnetworkdatayang tersimpan dalamindex_traindan beri namatraining_set. - Buat himpunan uji dengan mengecualikan baris
studentnetworkdatayang tersimpan dalamindex_traindan beri namatest_set.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set the seed
set.seed(___)
# Creat the index vector
index_train <- sample(1:nrow(___), 2 / 3 * nrow(___))
# Make the training set
training_set <- ___[index_train,]
# Make the test set
___ <- ___[-index_train,]