1. 学ぶ
  2. /
  3. コース
  4. /
  5. dplyr で行うデータの結合

Connected

演習

タグ付き投稿の結合とカウント

前の演習で作成したテーブルは、questions_with_tags と answers_with_tags として読み込まれています。まず、これらを posts_with_tags という1つのテーブルに結合しましょう。1つのテーブルに情報をまとめたら、lubridate パッケージ(すでに読み込み済み)を使って日付変数を作成し、さらに情報を追加できます。

questions_with_tags <- questions %>%
  inner_join(question_tags, by = c("id" = "question_id")) %>%
  inner_join(tags, by = c("tag_id" = "id"))
answers_with_tags <- answers %>%
  inner_join(question_tags, by = "question_id") %>%
  inner_join(tags, by = c("tag_id" = "id"))

指示

100 XP
  • questions_with_tags と answers_with_tags のテーブルを結合して posts_with_tags を作成します。
  • posts_with_tags に year 列を追加し、type、year、tag_name ごとに投稿数を集計します。