Subsetting
Ingat, perusahaan ingin memperluas bisnis dan menawarkan Hoppiness secara nasional. Oleh karena itu, model juga harus berfungsi pada data yang diperoleh dari toko baru. Salah satu cara untuk memeriksa bagaimana model Anda akan berkinerja pada data baru adalah dengan terlebih dahulu melatih model pada sebagian data, lalu mencoba memprediksi bagian data yang tersisa.
Anda membuat himpunan data pelatihan dengan menahan pembelian terakhir yang tercatat untuk setiap pelanggan. Anda dapat melakukannya dengan menggunakan fungsi subset() pada choice.data dan memilih semua observasi dengan variabel indikator LASTPURCHASE bernilai 0. Demikian pula, Anda membuat himpunan data uji dengan memilih semua observasi dengan variabel indikator LASTPURCHASE bernilai 1.
Latihan ini adalah bagian dari kursus
Membangun Model Respons di R
Petunjuk latihan
- Sisakan pembelian terakhir untuk membuat himpunan data pelatihan. Gunakan fungsi
subset()padachoice.data. TentukanLASTPURCHASE == 0sebagai argumensubset. Tetapkan hasilnya ketrain.data. - Buat himpunan data uji dengan menggunakan fungsi
subset()padachoice.data. TentukanLASTPURCHASE == 1sebagai argumensubset. Tetapkan hasilnya ketest.data.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the training data
# Create the test data