MulaiMulai sekarang secara gratis

Memasang model pada data pelatihan

Sekarang saatnya membagi data Anda menjadi himpunan training untuk memasang model dan himpunan test terpisah untuk mengevaluasi daya prediksi model. Namun sebelum melakukan pembagian ini, terlebih dahulu kita mengambil sampel 100% baris house_prices tanpa pengembalian dan menetapkannya ke house_prices_shuffled. Ini akan "mengacak" urutan baris sehingga himpunan training dan test diambil secara acak.

Latihan ini adalah bagian dari kursus

Pemodelan dengan Data di Tidyverse

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Set random number generator seed value for reproducibility
set.seed(76)

# Randomly reorder the rows
house_prices_shuffled <- house_prices %>% 
  sample_frac(size = 1, replace = FALSE)

# Train/test split
train <- house_prices_shuffled %>%
  slice(___:___)
test <- house_prices_shuffled %>%
  slice(___:___)
Edit dan Jalankan Kode