1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dự đoán với dữ liệu mạng trong R

Connected

Bài tập

Trích xuất các loại cạnh

Trong bài tập này, bạn sẽ đối chiếu các customer ID trong dataframe khách hàng với edgelist khách hàng để xác định mỗi cạnh là churn, non-churn hay cạnh hỗn hợp. Sử dụng hàm match(), bạn sẽ thêm hai cột vào edgelist.

  1. fromLabel với trạng thái churn của cột from
  2. toLabel với trạng thái churn của cột to

Lệnh match(x, y) trả về một vector chứa vị trí của x trong y. Trong hình trên, match(edgeList$from, customers$id) là 1,1,1,2,2. Ví dụ, dòng thứ tư trong edgeList$from, là khách hàng có id 393, là phần tử thứ hai trong customers$id. Vì vậy, nhãn churn của khách hàng này là customers[2,2] hoặc 0. Tương tự, nhãn churn của tất cả phần tử trong edgeList$from là customers[match(edgeList$from, customers$id),2].

Hướng dẫn

100 XP
  • Thêm một cột tên FromLabel vào dataframe edgeList với nhãn của các nút from bằng cách đối chiếu customers$id với edgeList$from và trích xuất customers$churn.
  • Làm tương tự cho các cạnh to, và đặt tên cột này là ToLabel.
  • Thêm một cột tên edgeType vào dataframe edgeList là tổng của các cột FromLabel và ToLabel.
  • Dùng hàm table() để xem số lượng của từng loại cạnh.