1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การรวมข้อมูลด้วย pandas

Connected

แบบฝึกหัด

การ Join ตารางกับตัวเอง

การ merge ตารางกับตัวเองมีประโยชน์เมื่อต้องการเปรียบเทียบค่าในคอลัมน์หนึ่งกับค่าอื่นในคอลัมน์เดียวกัน ในแบบฝึกหัดนี้ จะสร้างตารางที่แสดงผู้กำกับและสมาชิกทีมงานของแต่ละภาพยนตร์ไว้ในแถวเดียวกัน โดยมีตารางชื่อ crews ที่มีคอลัมน์ id, job และ name ให้แล้ว ขั้นแรกให้ merge ตารางนี้กับตัวเองโดยใช้ ID ของภาพยนตร์ การ merge นี้จะได้ตารางขนาดใหญ่ขึ้น ซึ่งแต่ละตำแหน่งงานจะถูกจับคู่กับตำแหน่งอื่นทุกตำแหน่ง จากนั้นเลือกเฉพาะแถวที่มีผู้กำกับในตารางฝั่งซ้าย และกรองออกแถวที่ตำแหน่งผู้กำกับปรากฏทั้งในตารางซ้ายและขวา การกรองนี้จะตัดคู่ตำแหน่งที่ไม่เกี่ยวข้องกับผู้กำกับออกไป

ตาราง crews ได้โหลดไว้ให้แล้ว

คำแนะนำ 1/3

undefined XP
    1
    2
    3
  • สร้างตัวแปรชื่อ crews_self_merged โดย merge ตาราง crews กับตัวเองบนคอลัมน์ id ด้วย inner join และกำหนด suffixes เป็น '_dir' สำหรับตารางฝั่งซ้าย และ '_crew' สำหรับตารางฝั่งขวา