1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การทำความสะอาดข้อมูลใน Python

Connected

แบบฝึกหัด

ย้อนเวลากลับสู่อนาคต

มีการอัปเดต data pipeline ที่ป้อนข้อมูลเข้าสู่ DataFrame ride_sharing เพื่อบันทึกวันที่ของการเดินทางแต่ละครั้ง โดยข้อมูลนี้เก็บอยู่ในคอลัมน์ ride_date ซึ่งมีชนิดข้อมูลเป็น object หรือ string ใน pandas

พบบั๊กที่ทำให้การเดินทางที่เกิดขึ้นในวันนี้ถูกบันทึกเป็นปีหน้าแทน เพื่อแก้ไขปัญหานี้ ให้ค้นหาทุกแถวในคอลัมน์ ride_date ที่มีวันที่อยู่ในอนาคต แล้วกำหนดค่าสูงสุดของคอลัมน์นี้ให้เป็นวันที่ปัจจุบัน ก่อนดำเนินการดังกล่าว จะต้องแปลง ride_date ให้เป็นออบเจ็กต์ datetime ก่อน

แพ็กเกจ datetime ถูก import ไว้แล้วในชื่อ dt พร้อมกับแพ็กเกจอื่นๆ ที่ใช้มาก่อนหน้านี้

คำแนะนำ

100 XP
  • แปลง ride_date ให้เป็นออบเจ็กต์ datetime โดยใช้ to_datetime() จากนั้นแปลงออบเจ็กต์ datetime ให้เป็น date แล้วเก็บผลลัพธ์ไว้ในคอลัมน์ ride_dt
  • สร้างตัวแปร today เพื่อเก็บวันที่ปัจจุบันโดยใช้ฟังก์ชัน dt.date.today()
  • สำหรับทุกแถวใน ride_dt ที่มีวันที่อยู่ในอนาคต ให้กำหนดค่าเป็นวันที่ปัจจุบัน
  • แสดงวันที่สูงสุดในคอลัมน์ ride_dt