Membuat himpunan data training dan test
Paket rsample dirancang untuk membuat himpunan data training dan test. Membuat himpunan data test penting untuk memperkirakan bagaimana kinerja model terlatih pada data baru. Ini juga melindungi dari overfitting, ketika model menghafal pola yang hanya ada pada data training dan berkinerja buruk pada data baru.
Dalam latihan ini, Anda akan membuat himpunan data training dan test dari data home_sales. Data ini berisi informasi rumah yang terjual di wilayah Seattle, Washington antara tahun 2015 dan 2016.
Variabel keluaran pada data ini adalah selling_price.
Paket tidymodels akan dimuat sebelumnya di setiap latihan dalam kursus ini. Tibble home_sales juga telah disiapkan untuk Anda.
Latihan ini adalah bagian dari kursus
Pemodelan dengan tidymodels di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a data split object
home_split <- ___(home_sales,
prop = ___,
strata = ___)