1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với pandas

Connected

Bài tập

Phần tiếp theo (sequel) có kiếm được nhiều hơn không?

Đến lúc bạn áp dụng nhiều khía cạnh đã học trong chương này. Trong bài tập này, bạn sẽ tìm ra phần tiếp theo (sequel) nào kiếm được nhiều tiền nhất so với phim gốc. Để trả lời, bạn sẽ gộp phiên bản đã chỉnh sửa của bảng sequels và financials nơi chỉ số (index) là ID phim. Bạn cần chọn kiểu gộp (merge) sao cho trả về tất cả các hàng từ bảng sequels, và không nhất thiết phải bao gồm mọi hàng của bảng financials trong kết quả. Từ đó, bạn sẽ nối (join) bảng kết quả với chính nó để so sánh doanh thu của phim gốc với phần tiếp theo. Tiếp theo, bạn sẽ tính chênh lệch giữa hai doanh thu và sắp xếp tập dữ liệu thu được.

Bảng sequels và financials đã được cung cấp.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Với bảng sequels ở bên trái, gộp (merge) bảng financials vào dựa trên index tên id, đảm bảo trả về tất cả các hàng từ sequels và có thể không trả về một số hàng từ bảng còn lại. Lưu kết quả vào sequels_fin.