1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với R

Connected

Bài tập

Tự xây dựng mô hình phát hiện của bạn

Hãy kết hợp các công cụ bạn đã thấy trong chương này. Bộ dữ liệu chuyển khoản tín dụng từ các bài trước đã được tách thành tập huấn luyện và tập kiểm tra với cùng mức mất cân bằng lớp. Tiếp theo, SMOTE được áp dụng trên tập huấn luyện. Bạn sẽ xây dựng mô hình cây phân loại trên cả tập huấn luyện gốc bị mất cân bằng và tập huấn luyện đã cân bằng lại. Cuối cùng, so sánh cả hai mô hình trên cùng một tập kiểm tra.

Thư viện rpart và caret đã được nạp sẵn trong không gian làm việc của bạn. Đừng ngần ngại xem lại các slide để hoàn thành bài tập này.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Huấn luyện các mô hình cây phân loại model_orig và model_smote bằng rpart trên tập huấn luyện gốc train_original và tập huấn luyện đã cân bằng bằng SMOTE train_oversampled, tương ứng. Dùng Class làm biến phản hồi.