MulaiMulai sekarang secara gratis

Membuat himpunan data training dan test

Paket rsample dirancang untuk membuat himpunan data training dan test. Membuat himpunan data test penting untuk memperkirakan bagaimana kinerja model terlatih pada data baru. Ini juga melindungi dari overfitting, ketika model menghafal pola yang hanya ada pada data training dan berkinerja buruk pada data baru.

Dalam latihan ini, Anda akan membuat himpunan data training dan test dari data home_sales. Data ini berisi informasi rumah yang terjual di wilayah Seattle, Washington antara tahun 2015 dan 2016.

Variabel keluaran pada data ini adalah selling_price.

Paket tidymodels akan dimuat sebelumnya di setiap latihan dalam kursus ini. Tibble home_sales juga telah disiapkan untuk Anda.

Latihan ini adalah bagian dari kursus

Pemodelan dengan tidymodels di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a data split object
home_split <- ___(home_sales, 
                  prop = ___, 
                  strata = ___)
Edit dan Jalankan Kode