1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với dplyr

Connected

Bài tập

Tìm một quan sát không có bản ghép tương ứng

Left join rất hữu ích để kiểm tra các giả định về bộ dữ liệu và đảm bảo tính toàn vẹn dữ liệu.

Ví dụ, bảng inventories có cột version, dùng khi một bộ LEGO có thay đổi hoặc nâng cấp. Bạn có thể giả định hợp lý rằng tất cả sets (bảng này nối tốt với inventories) đều có ít nhất phiên bản 1. Nhưng hãy kiểm chứng giả định này trong bài tập sau.

Hướng dẫn

100 XP
  • Dùng left_join để nối sets và inventory_version_1 bằng cột chung của chúng.
  • filter các dòng mà cột version là NA bằng is.na.