Menemukan ambang optimal

Bayangkan Anda menjalankan sebuah kampanye dengan tujuan mencegah pelanggan gagal bayar (default). Anda dapat merancang kampanye dengan bantuan prediksi Anda. Oleh karena itu, pemilihan ambang (threshold) sangat menentukan hasil Anda. Jika Anda mengetahui biaya dan imbal hasil kampanye, Anda dapat memeriksa secara empiris ambang mana yang paling masuk akal. Dalam latihan ini, kita menghadapi skenario berikut:

Jika seorang pelanggan tidak gagal bayar karena kampanye kita, yaitu jika kita memprediksi gagal bayar dengan benar (true positive), kita memperoleh imbal hasil sebesar 1000€. Namun, jika kita menargetkan kampanye pada pelanggan yang sebenarnya tidak akan gagal bayar, yaitu jika kita keliru memprediksi pelanggan tersebut (false positive) akan gagal bayar, kita menanggung biaya sebesar 250€.

Dari latihan sebelumnya kita tahu bahwa model terbatas adalah yang terbaik. Jadi hitunglah hanya ambang optimal untuk model tersebut. Prediksi disimpan dalam kolom predNew pada dataframe defaultData. Gunakan paket SDMTools.

Latihan ini merupakan bagian dari kursus

Machine Learning untuk Analitik Pemasaran dengan R

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

library(SDMTools)

# Confusion matrix with threshold 0.5
confMat <- confusion.matrix(defaultData$PaymentDefault,
                               defaultData$predNew, 
                               threshold = ___)
confMat

Edit dan Jalankan Kode