1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Phân tích Marketing bằng R

Connected

Bài tập

Tìm ngưỡng tối ưu

Hãy tưởng tượng bạn đang chạy một chiến dịch nhằm ngăn khách hàng bị vỡ nợ (default). Bạn có thể thiết kế chiến dịch dựa trên các dự báo của mình. Vì vậy, lựa chọn ngưỡng (threshold) là yếu tố then chốt cho kết quả. Nếu bạn biết chi phí và phần thưởng của chiến dịch, bạn có thể kiểm tra thực nghiệm ngưỡng nào hợp lý nhất. Trong bài tập này, chúng ta ở trong kịch bản sau:

Nếu một khách hàng không bị vỡ nợ nhờ chiến dịch của chúng ta, tức là chúng ta dự đoán đúng việc vỡ nợ (true positive), bạn nhận được phần thưởng 1000€. Tuy nhiên, nếu chiến dịch nhắm vào một khách hàng vốn dĩ sẽ không vỡ nợ, tức là chúng ta dự đoán sai (false positive) rằng khách hàng sẽ vỡ nợ, bạn phải chịu chi phí 250€.

Từ bài tập trước, ta biết mô hình rút gọn (restricted model) là tốt nhất. Vì vậy, chỉ tính ngưỡng tối ưu cho mô hình đó. Các dự báo được lưu trong cột predNew của dataframe defaultData. Hãy dùng gói SDMTools.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Luyện tập: tạo một ma trận nhầm lẫn với ngưỡng 0.5. Xem ma trận và nhớ lại vị trí của true positive và false positive.