1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với dplyr

Connected

Bài tập

So sánh các mảnh LEGO của Batman và Star Wars

Bảng bạn tạo ở bài trước gồm số hiệu của từng mảnh (part number), mã màu (color id), và số lượng của từng mảnh trong chủ đề Star Wars và Batman. Tuy nhiên, bạn có thể khai thác thêm thông tin về các mảnh này bằng cách kết hợp bảng đó với dữ liệu ở các bảng khác. Trước khi so sánh các chủ đề, hãy đảm bảo bạn có đủ thông tin để việc phân tích dễ hiểu hơn. Bảng từ bài trước đã được lưu là parts_joined và đã được nạp sẵn cho bạn.

parts_joined <- batman_parts %>%
  full_join(star_wars_parts, by = c("part_num", "color_id"), suffix = c("_batman", "_star_wars")) %>%
  replace_na(list(n_batman = 0, n_star_wars = 0))

Hướng dẫn

100 XP
  • Sắp xếp số lượng mảnh Star Wars trong bảng parts_joined theo thứ tự giảm dần.
  • Thực hiện inner join bảng colors với bảng parts_joined.
  • Kết hợp bảng parts vào kết quả join ở bước trước bằng inner join; thêm hậu tố "_color" và "_part" để chỉ rõ thông tin đến từ bảng colors hay bảng parts.