Memasang model pada data pelatihan
Sekarang saatnya membagi data Anda menjadi himpunan training untuk memasang model dan himpunan test terpisah untuk mengevaluasi daya prediksi model. Namun sebelum melakukan pembagian ini, terlebih dahulu kita mengambil sampel 100% baris house_prices tanpa pengembalian dan menetapkannya ke house_prices_shuffled. Ini akan "mengacak" urutan baris sehingga himpunan training dan test diambil secara acak.
Latihan ini adalah bagian dari kursus
Pemodelan dengan Data di Tidyverse
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set random number generator seed value for reproducibility
set.seed(76)
# Randomly reorder the rows
house_prices_shuffled <- house_prices %>%
sample_frac(size = 1, replace = FALSE)
# Train/test split
train <- house_prices_shuffled %>%
slice(___:___)
test <- house_prices_shuffled %>%
slice(___:___)