1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การรวมข้อมูลด้วย pandas

Connected

แบบฝึกหัด

ใช้ outer join เพื่อเลือกข้อมูลนักแสดง

จุดเด่นอย่างหนึ่งของ outer join คือ มันจะคืนค่าทุกแถวจากทั้งสองตาราง และใส่ค่า null ในจุดที่ไม่มีข้อมูลตรงกัน ทำให้สามารถใช้ค้นหาแถวที่ไม่มีคู่ในอีกตารางได้

ในแบบฝึกหัดนี้ คุณมีตารางสองชุดที่บรรจุรายชื่อนักแสดงจากภาพยนตร์ยอดนิยมสองเรื่อง ได้แก่ Iron Man 1 และ Iron Man 2 นักแสดงส่วนใหญ่แสดงในทั้งสองเรื่อง ลองใช้ outer join เพื่อค้นหานักแสดงที่ไม่ได้แสดงในทั้งสองเรื่อง

ตาราง Iron Man 1 มีชื่อว่า iron_1_actors และตาราง Iron Man 2 มีชื่อว่า iron_2_actors ทั้งสองตารางถูกโหลดไว้แล้ว พร้อมแสดงตัวอย่างข้อมูลบางแถวเพื่อให้เห็นโครงสร้าง

Venn graph with no overlap

คำแนะนำ

100 XP
  • บันทึกผลลัพธ์ลงในตัวแปร iron_1_and_2 โดย merge ตาราง iron_1_actors (ซ้าย) กับ iron_2_actors ด้วย outer join บนคอลัมน์ id และกำหนด suffixes เป็น ('_1','_2')
  • สร้าง index ที่คืนค่า True หาก name_1 หรือ name_2 เป็น null และคืนค่า False ในกรณีอื่น