1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với pandas

Connected

Bài tập

Dùng outer join để chọn diễn viên

Một điểm hay của outer join là vì nó trả về tất cả các hàng từ cả hai bảng được gộp, và điền null ở nơi không khớp, bạn có thể dùng nó để tìm các hàng không có bản khớp ở bảng còn lại. Hãy tự thử với hai bảng chứa danh sách diễn viên của hai bộ phim nổi tiếng: Iron Man 1 và Iron Man 2. Phần lớn diễn viên tham gia cả hai phim. Hãy dùng outer join để tìm các diễn viên không đóng ở cả hai phim.

Bảng Iron Man 1 có tên iron_1_actors, và bảng Iron Man 2 có tên iron_2_actors. Cả hai bảng đã được nạp sẵn và một vài hàng đã được in ra để bạn thấy cấu trúc.

Venn graph with no overlap

Hướng dẫn

100 XP
  • Lưu vào iron_1_and_2 kết quả merge bảng iron_1_actors (trái) với iron_2_actors bằng outer join trên cột id, và đặt hậu tố là ('_1','_2').
  • Tạo một chỉ mục trả về True nếu name_1 hoặc name_2 là null, và False nếu không.