1. 학습
  2. /
  3. 강의
  4. /
  5. 사례 연구: R로 하는 네트워크 분석

Connected

연습 문제

중요한 상품을 가르는 요인은 무엇일까요?

이제 중요한 상품의 작동 정의를 만들었으니, 이들이 상관될 수 있는 속성이 있는지 살펴보겠습니다. 후보 쌍으로는 salesrank.from과 salesrank.to가 있습니다. 중요한 상품이 다운스트림에서 사람들이 구매하는 상품보다 더 높은 판매 순위를 갖는 경향이 있는지 물어볼 수 있겠죠. 이를 확인하기 위해 먼저 중요한 정점만 부분 집합으로 추출하고, 이를 초기 데이터프레임과 다시 조인한 뒤, dplyr 패키지를 사용해 새로운 데이터프레임을 만들겠습니다. 그런 다음 새 그래프를 만들고, 순위가 높은(1, 2, 3) 쪽에서 낮은(20, 21, 22) 쪽으로 갈수록 간선을 파란색으로, 그 반대는 빨간색으로 칠하겠습니다. 만약 순위가 다운스트림 구매와 상관된다면 대부분 파란 링크가 보일 것이고, 관계가 없다면 빨간색과 파란색이 비슷하게 섞여 보일 것입니다.

데이터셋 ip_df에는 중요한 상품에 대한 정보가 담겨 있습니다.

지침 1/2

undefined XP
    1
    2
  • ip_df에서 from과 to 열을 선택해 ip_df_from_to에 할당하세요.
  • graph_from_data_frame()을 사용해 ip_df_from_to로부터 ‘방향성 있는’ 그래프를 만드세요.
  • ip_df$salesrank.from이 ip_df$salesrank.to보다 작거나 같으면 간선 색을 파란색으로, 그렇지 않으면 빨간색으로 지정하세요.