1. 학습
  2. /
  3. 강의
  4. /
  5. Kết hợp dữ liệu với pandas

Connected

연습 문제

Tự nối (self join)

Nối một bảng với chính nó hữu ích khi bạn muốn so sánh các giá trị trong một cột với các giá trị khác trong cùng cột. Trong bài tập này, bạn sẽ luyện tập bằng cách tạo một bảng mà với mỗi bộ phim sẽ liệt kê đạo diễn và một thành viên trong đoàn làm phim trên cùng một hàng. Bạn có sẵn bảng crews với các cột id, job và name. Đầu tiên, hãy nối bảng này với chính nó bằng ID của bộ phim. Lần nối này sẽ tạo ra một bảng lớn hơn, trong đó với mỗi bộ phim, mọi công việc (job) được ghép cặp với nhau. Sau đó, chỉ chọn các hàng có đạo diễn ở bảng bên trái, và tránh tạo ra hàng mà công việc của đạo diễn xuất hiện ở cả bảng trái và phải. Việc lọc này sẽ loại bỏ các tổ hợp công việc không phải với đạo diễn.

Bảng crews đã được nạp sẵn cho bạn.

지침 1/3

undefined XP
    1
    2
    3
  • Gán vào biến crews_self_merged phép nối bảng crews với chính nó trên cột id bằng inner join, đặt hậu tố lần lượt cho bảng trái và phải là '_dir' và '_crew'.