1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với R

Connected

Bài tập

Đặc trưng tần suất cho một tài khoản

Một đặc trưng tần suất (frequency feature) đếm số lần một sự kiện nào đó đã xảy ra trong quá khứ. Tạo các đặc trưng như vậy giúp phát hiện hành vi bất thường. Trong video, bạn đã học cách tạo một đặc trưng tần suất dựa trên một đặc trưng phân loại.

Hiện bạn có dữ liệu giao dịch của Bob. Một trong các cột là channel_cd cho biết kênh thanh toán mà Bob dùng để thực hiện từng giao dịch. Bạn sẽ tạo một đặc trưng tần suất tên là freq_channel dựa trên cột channel_cd bằng hàm rollapply(). Bạn có thể dùng ?rollaply trong console để xem tài liệu của hàm.

Bộ dữ liệu trans_Bob, cùng với các gói zoo và dplyr, đã được nạp vào không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Viết hàm frequency_fun() nhận steps và channel làm đầu vào, đếm số bước và cộng số lần channel mới nhất đã được dùng trong quá khứ.
  • Tạo đặc trưng freq_channel bằng cách dùng hàm rollapply trên cột transfer_id. Đặc trưng này phải đếm số lần một channel_cd cụ thể đã được dùng trước đó.
  • In các đặc trưng channel_cd, freq_channel và fraud_flag. Kiểm tra đặc trưng vừa tạo.