1. 学ぶ
  2. /
  3. コース
  4. /
  5. dplyr で行うデータの結合

Connected

演習

質問とタグのleft join

Stack Overflow のサーベイデータには questions、question_tags、tags の3つのデータセットがあります。

  • questions: 質問のIDとスコア(どれだけアップボートされたか)。データはR関連の質問のみを含みます。
  • question_tags: 各質問に対するタグIDと、その質問のid。
  • tags: タグIDとタグ名。ggplot2 や dplyr など、各質問のテーマを特定するのに使えます。

この演習では、これらのデータセットを結合して、重要な列に含まれる NA を置き換えます。

この演習では、対応するタグがない質問もすべて保持するために left_join を使います。ただし、questions はすべてR関連のデータであることが分かっているので、replace_na を使って手動で R の質問としてタグ付けしておきます。

指示1 / 3

undefined XP
    1
    2
    3
  • questions と question_tags を、それぞれ id 列と question_id 列で結合します(left_join を使います)。