1. 学ぶ
  2. /
  3. コース
  4. /
  5. dplyr で行うデータの結合

Connected

演習

質問ごとの平均回答数

前の演習で作成したテーブルは、tagged_answers としてあらかじめ読み込まれています。このテーブルを使って、各質問が平均していくつの回答を得ているかを調べましょう。

tagged_answers <- question_answer_counts %>%
    inner_join(question_tags, by = c("id" = "question_id")) %>%
    inner_join(tags, by = c("tag_id" = "id"))

このテーブルの重要な変数として、各質問の回答数を表す n、各質問に関連付けられたタグ名を表す tag_name があります。

それでは、おなじみの dplyr の動詞を使って、各質問が平均していくつの回答を得ているのかを求めてみましょう。

指示

100 XP
  • tagged_answers テーブルを tag_name で集計します。
  • tagged_answers を要約して、questions(件数)と average_answers(平均回答数)を求めます。
  • 得られた questions 列を降順で並べ替えます。