1. 学ぶ
  2. /
  3. コース
  4. /
  5. Kết hợp dữ liệu với dplyr

Connected

演習

Gộp (aggregate) các bộ để xem sự khác biệt của chúng

Để so sánh hai bộ (set) riêng lẻ và các loại mảnh LEGO cấu thành chúng, bạn sẽ cần gộp dữ liệu theo từng chủ đề (theme) riêng. Ngoài ra, như đã thấy trong video, bạn sẽ muốn thêm một cột để tính tỷ phần (fraction) của các mảnh cụ thể thuộc mỗi bộ, thay vì chỉ nhìn vào số lượng mảnh.

Bảng inventory_parts_themes đã được nạp sẵn cho bạn.

inventory_parts_themes <- inventories %>%
  inner_join(inventory_parts, by = c("id" = "inventory_id")) %>%
  arrange(desc(quantity)) %>%
  select(-id, -version) %>%
  inner_join(sets, by = "set_num") %>%
  inner_join(themes, by = c("theme_id" = "id"), suffix = c("_set", "_theme"))

指示

100 XP
  • Thêm bộ lọc cho chủ đề "Batman" để tạo đối tượng batman_colors.
  • Thêm một cột fraction vào batman_colors hiển thị tổng chia cho tổng của toàn bộ (sum of the total).
  • Lặp lại các bước lọc và gộp cho dữ liệu bộ "Star Wars" để tạo đối tượng star_wars_colors.
  • Thêm một cột fraction vào star_wars_colors để hiển thị tỷ phần của tổng.