1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dự đoán với dữ liệu mạng trong R

Connected

Bài tập

Suy luận tập thể (Collective Inferencing)

Suy luận tập thể là một quy trình gán nhãn đồng thời cho các nút trong dữ liệu có liên kết để giảm lỗi phân loại.

Trong bài này, bạn sẽ thực hiện suy luận tập thể và xem tác động của nó đến dự báo rời bỏ (churn) thông qua thước đo hiệu năng AUC. AUC, hay diện tích dưới đường cong ROC, thường được dùng để đánh giá hiệu năng của các kỹ thuật phân loại.

  • AUC = xác suất rằng một khách hàng rời bỏ được chọn ngẫu nhiên được mô hình xếp hạng cao hơn một khách hàng không rời bỏ được chọn ngẫu nhiên
  • AUC = một số nằm giữa 0.5 và 1, số càng cao nghĩa là mô hình càng tốt

Suy luận tập thể có làm tăng giá trị AUC không?

Hướng dẫn

100 XP
  • Tính AUC của bộ phân loại hàng xóm quan hệ bằng cách gọi hàm auc trong gói pROC, sử dụng nhãn churn thực tế customers$churn và churnProb làm giá trị dự đoán.
  • Viết một vòng lặp for áp dụng bộ phân loại hàng xóm quan hệ xác suất mười lần, và mỗi lần lặp lại gán lại giá trị cho vector churnProb.
  • Tính lại AUC với vector churnProb đã được cập nhật.