Pengujian out-of-sample
Tujuan Anda adalah membuat prediksi pembelian untuk toko-toko baru berdasarkan model yang telah Anda estimasi. Anda memeriksa apakah tujuan ini layak dilakukan dengan menggunakan fungsi predict(). Fungsi predict() mengambil estimasi parameter dari train.model untuk membuat prediksi terhadap variabel respons dalam test.data. Untuk memperoleh nilai prediksi pada skala variabel respons (probabilitas pembelian yang diprediksi), Anda harus mengatur argumen tambahan type ke "response".
Terakhir, prediksi hold-out diklasifikasikan menjadi pembelian dan bukan pembelian menggunakan fungsi ifelse() dan dibandingkan dengan pembelian yang teramati menggunakan fungsi table(). Terakhir, Anda menggunakan fungsi prop.table() untuk mengonversi angka dalam tabel menjadi angka relatif.
Latihan ini adalah bagian dari kursus
Membangun Model Respons di R
Petunjuk latihan
- Prediksi respons untuk
test.datadengan menggunakan fungsipredict()padatrain.model. Atur argumentypeke"response"dan beri nama hasilnyaprobability. - Klasifikasikan prediksi model menjadi
1jikaprobabilitymelebihi0.5dan0jika tidak. Simpan hasilnya ke objekpredicted. - Peroleh pembelian teramati untuk
HOPPINESSdaritest.data. Simpan ke objekobserved. - Silangkan tabulasi vektor data
observeddanpredictedmenggunakan fungsitable()danprop.table().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Predict the purchase probabilities for test.data
probability <- ___(___, ___, type = "response")
# Classify the predictions
predicted <- ___(probability >= ___, ___, ___)
# Obtain the observed purchases from test.data
observed <- test.data$HOPPINESS
# Cross-tabulate observed vs. predicted purchases
___(___(predicted, observed))