1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với R

Connected

Bài tập

Bộ phân loại láng giềng quan hệ

Mô hình quan hệ dựa trên ý tưởng rằng hành vi giữa các nút có tương quan, nghĩa là các nút được nối với nhau có xu hướng thuộc cùng một lớp. Đặc biệt, bộ phân loại láng giềng quan hệ dự đoán lớp của một nút dựa trên các nút láng giềng và các cạnh kề của nó.

Tập dữ liệu transfers gồm các giao dịch từ nhiều tài khoản khác nhau. Dữ liệu account_info cho biết tài khoản nào trong số này là "money mule". Tuy nhiên, chưa biết tài khoản "I41" có phải là money mule hay không. Hãy dự đoán xác suất tài khoản "I41" là money mule bằng bộ phân loại láng giềng quan hệ.

Hướng dẫn

100 XP
  • Tạo một đồ thị vô hướng tên net dựa trên transfers. Đặt directed thành giá trị boolean phù hợp (TRUE hoặc FALSE).
  • Chỉ định màu cho từng nút: đặt V(net)$color là "darkorange" nếu account_info$isMoneyMule == TRUE, ngược lại là "slateblue1".
  • Dùng subgraph() trên net để tạo một đồ thị con tên subnet chứa các đỉnh "I41","I47", "I87" và "I20".
  • Dùng hàm strength() trên subnet và trên net để tính xác suất là money mule của nút "I41" dưới dạng tỉ lệ láng giềng là mule