1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การรวมข้อมูลด้วย pandas

Connected

แบบฝึกหัด

การทำ Semi Join

แทร็กที่สร้างรายได้สูงสุดบางส่วนมาจากรายการโทรทัศน์หรือเป็นไฟล์เสียงที่ไม่ใช่ดนตรี คุณมีตารางใบแจ้งหนี้ที่รวมรายการสร้างรายได้สูงสุด และยังมีตารางแทร็กที่ไม่ใช่ดนตรีจากบริการสตรีมมิ่งอีกด้วย ในแบบฝึกหัดนี้ จะใช้ semi join เพื่อค้นหาแทร็กที่ไม่ใช่ดนตรีซึ่งสร้างรายได้สูงสุด

ตาราง non_mus_tcks, top_invoices และ genres ถูกโหลดไว้ให้แล้ว

คำแนะนำ

100 XP
  • Merge non_mus_tcks และ top_invoices บน tid โดยใช้ inner join แล้วบันทึกผลลัพธ์เป็น tracks_invoices
  • ใช้ .isin() เพื่อกรองแถวใน non_mus_tcks ที่ tid ปรากฏอยู่ในคอลัมน์ tid ของ tracks_invoices แล้วบันทึกผลลัพธ์เป็น top_tracks
  • จัดกลุ่ม top_tracks ตาม gid และนับจำนวนแถวของ tid แล้วบันทึกผลลัพธ์เป็น cnt_by_gid
  • Merge cnt_by_gid กับตาราง genres บน gid แล้วแสดงผลลัพธ์