1. Learn
  2. /
  3. Courses
  4. /
  5. tidyverse で学ぶカテゴリ型データ

Connected

Exercise

データの要約

次は、学習プラットフォームごとの有用性を比較するために、ファセット付きのプロットを作成します。

この演習では、新しい dplyr の関数 add_count() を紹介します。add_count() はデータセットに列 n を追加し、元のデータと同じ行数を保ちます。count() と同様に、デフォルトでは各グループの行数が n に入りますが、wt(重み)引数で変更できます。wt に別の列を指定すると、各グループについてその列の合計が n になります。

例えば、iris に、同じ Species の花について Petal.Length の合計を表す列を追加したいとします。次のように書きます。

iris %>%
   add_count(Species, wt = Petal.Length) %>%
   select(Species, Petal.Length, n)

すると、次のような結果が得られます。

# A tibble: 150 x 3
   Species Petal.Length     n
   <fct>          <dbl> <dbl>
 1 setosa           1.4  73.1
 2 setosa           1.4  73.1
 3 virginica        6.4  278.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • count() を使って、learning_platform と usefulness の組み合わせごとに1行になるようデータセットを変換し、その組み合わせの件数を表す列を作成します。