Menemukan ambang optimal
Bayangkan Anda menjalankan sebuah kampanye dengan tujuan mencegah pelanggan gagal bayar (default). Anda dapat merancang kampanye dengan bantuan prediksi Anda. Oleh karena itu, pemilihan ambang (threshold) sangat menentukan hasil Anda. Jika Anda mengetahui biaya dan imbal hasil kampanye, Anda dapat memeriksa secara empiris ambang mana yang paling masuk akal. Dalam latihan ini, kita menghadapi skenario berikut:
Jika seorang pelanggan tidak gagal bayar karena kampanye kita, yaitu jika kita memprediksi gagal bayar dengan benar (true positive), kita memperoleh imbal hasil sebesar 1000€. Namun, jika kita menargetkan kampanye pada pelanggan yang sebenarnya tidak akan gagal bayar, yaitu jika kita keliru memprediksi pelanggan tersebut (false positive) akan gagal bayar, kita menanggung biaya sebesar 250€.
Dari latihan sebelumnya kita tahu bahwa model terbatas adalah yang terbaik. Jadi hitunglah hanya ambang optimal untuk model tersebut. Prediksi disimpan dalam kolom predNew pada dataframe defaultData. Gunakan paket SDMTools.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Analitik Pemasaran dengan R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(SDMTools)
# Confusion matrix with threshold 0.5
confMat <- confusion.matrix(defaultData$PaymentDefault,
defaultData$predNew,
threshold = ___)
confMat