1. 学ぶ
  2. /
  3. コース
  4. /
  5. dplyr で行うデータの結合

Connected

演習

セットを集計して違いを見てみましょう

2つの個別のセットと、それらを構成するLEGOパーツの種類を比較するには、データをテーマごとに集計する必要があります。さらに、動画で見たように、単にパーツ数だけを見るのではなく、各セットに占める特定パーツの割合がわかるよう、列を追加したいところです。

inventory_parts_themes テーブルはあらかじめ読み込まれています。

inventory_parts_themes <- inventories %>%
  inner_join(inventory_parts, by = c("id" = "inventory_id")) %>%
  arrange(desc(quantity)) %>%
  select(-id, -version) %>%
  inner_join(sets, by = "set_num") %>%
  inner_join(themes, by = c("theme_id" = "id"), suffix = c("_set", "_theme"))

指示

100 XP
  • "Batman" テーマでフィルターして、batman_colors オブジェクトを作成します。
  • 合計をその合計の総和で割った値を表示する fraction 列を batman_colors に追加します。
  • 同じ手順で "Star Wars" セットのデータをフィルター・集計して、star_wars_colors オブジェクトを作成します。
  • star_wars_colors にも、合計に対する割合を表示する fraction 列を追加します。