1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การรวมข้อมูลด้วย pandas

Connected

แบบฝึกหัด

ข้อควรระวังของ merge_ordered() เมื่อใช้หลายคอลัมน์

เมื่อใช้ merge_ordered() เพื่อรวมข้อมูลบนหลายคอลัมน์ ลำดับของคอลัมน์มีความสำคัญมาก โดยเฉพาะเมื่อใช้ร่วมกับฟีเจอร์ forward fill ฟังก์ชันจะเรียงลำดับการรวมข้อมูลตามคอลัมน์ที่ระบุไว้ตามลำดับ ในแบบฝึกหัดนี้ จะรวมข้อมูล GDP และประชากรจาก World Bank ของออสเตรเลียและสวีเดน โดยสลับลำดับของคอลัมน์ที่ใช้รวมข้อมูล ความถี่ของข้อมูลทั้งสองชุดแตกต่างกัน คือ ข้อมูล GDP มีความถี่รายไตรมาส ส่วนข้อมูลประชากรมีความถี่รายปี ให้ใช้ฟีเจอร์ forward fill เพื่อเติมข้อมูลที่ขาดหายไป ทั้งนี้ ลำดับของคอลัมน์ที่ระบุจะส่งผลต่อข้อมูลที่นำมาใช้เติม ซึ่งอาจทำให้ได้ผลลัพธ์ที่ไม่ตรงกับที่ต้องการ

ตารางข้อมูล gdp และ pop ถูกโหลดไว้แล้ว

คำแนะนำ 1/2

undefined XP
  • 1
    • ใช้ merge_ordered() กับ gdp และ pop โดยรวมข้อมูลบนคอลัมน์ date และ country พร้อมเปิดใช้ฟีเจอร์ fill แล้วบันทึกผลลัพธ์ไว้ในตัวแปร ctry_date
  • 2
    • รวมข้อมูล gdp และ pop ในลักษณะเดียวกัน แต่ให้ join บน country และ date (สลับลำดับจากขั้นตอนที่ 1) พร้อมเปิดใช้ฟีเจอร์ fill และบันทึกผลลัพธ์ไว้ในตัวแปร date_ctry