1. Învăţa
  2. /
  3. Courses
  4. /
  5. dplyr로 데이터 결합하기

Connected

exercise

질문과 태그를 left join으로 결합하기

Stack Overflow 설문 데이터셋 중 세 가지는 questions, question_tags, tags 입니다:

  • questions: 질문의 ID와 점수(해당 질문이 얼마나 많이 upvote되었는지). 이 데이터는 R 관련 질문만 포함합니다.
  • question_tags: 각 질문에 대한 태그 ID와 그 질문의 id
  • tags: 태그 id와 태그 이름. 예를 들어 ggplot2나 dplyr처럼 각 질문의 주제를 식별하는 데 사용할 수 있습니다.

이번 연습에서는 이 데이터셋들을 이어 붙이고, 중요한 필드의 NA를 적절한 값으로 바꿔 보겠습니다.

모든 질문을 유지하기 위해 이 연습에서는 left_join을 사용합니다. 해당 태그가 없는 질문도 포함되도록 하기 위함입니다. 다만 questions 데이터가 모두 R과 관련되어 있다는 것을 알고 있으므로, replace_na를 사용해 이들을 수동으로 R 질문으로 태깅해 주겠습니다.

Instrucțiuni 1 / 3

undefined XP
    1
    2
    3
  • 각각 id, question_id 열을 사용해 questions와 question_tags를 조인하세요.