1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Các nghiên cứu tình huống: Phân tích mạng lưới với R

Connected

Bài tập

Điều gì tạo nên một sản phẩm quan trọng?

Giờ khi bạn đã có một định nghĩa khả dụng về sản phẩm quan trọng, hãy xem chúng có đặc điểm nào có thể tương quan hay không. Một cặp ứng viên là salesrank.from và salesrank.to. Chúng ta có thể hỏi liệu các sản phẩm quan trọng có xu hướng có thứ hạng bán chạy (sales rank) cao hơn so với các sản phẩm được mua ở bước tiếp theo hay không. Ta sẽ kiểm tra điều này bằng cách trước tiên lọc ra các đỉnh quan trọng, nối chúng lại với dataframe ban đầu, rồi tạo một dataframe mới bằng gói dplyr. Sau đó, ta sẽ tạo một đồ thị mới và tô màu cạnh xanh dương cho trường hợp thứ hạng cao (1, 2, 3) đến thứ hạng thấp (20, 21, 22) và màu đỏ cho chiều ngược lại. Nếu thứ hạng tương quan với hành vi mua tiếp theo, bạn sẽ thấy chủ yếu là các liên kết màu xanh dương; nếu không có mối quan hệ, màu xanh và đỏ sẽ xuất hiện gần như ngang nhau.

Bộ dữ liệu ip_df chứa thông tin về các sản phẩm quan trọng.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Chọn các cột from và to từ ip_df, gán vào ip_df_from_to.
  • Dùng graph_from_data_frame() để tạo một đồ thị có hướng từ ip_df_from_to.
  • Định nghĩa màu cạnh là xanh dương nếu ip_df$salesrank.from nhỏ hơn hoặc bằng ip_df$salesrank.to, và đỏ nếu không.