1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với pandas

Connected

Bài tập

Thực hiện semi join

Một số bản nhạc tạo ra doanh thu lớn nhất lại đến từ các chương trình TV hoặc là các tệp âm thanh phi âm nhạc khác. Bạn được cung cấp một bảng hóa đơn chứa các mặt hàng tạo doanh thu hàng đầu. Ngoài ra, bạn còn có một bảng liệt kê các bản nhạc phi âm nhạc từ dịch vụ streaming. Trong bài tập này, bạn sẽ dùng semi join để tìm các bản nhạc phi âm nhạc mang lại doanh thu cao nhất.

Các bảng non_mus_tcks, top_invoices và genres đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Gộp non_mus_tcks và top_invoices trên tid bằng inner join. Lưu kết quả vào tracks_invoices.
  • Dùng .isin() để lọc các hàng của non_mus_tcks nơi tid nằm trong cột tid của tracks_invoices. Lưu kết quả vào top_tracks.
  • Nhóm top_tracks theo gid và đếm số hàng tid. Lưu kết quả vào cnt_by_gid.
  • Gộp cnt_by_gid với bảng genres trên gid và in kết quả.