1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การทำความสะอาดข้อมูลใน Python

Connected

แบบฝึกหัด

การบวกสตริงและการเชื่อมต่อตัวเลข

ในแบบฝึกหัดที่แล้ว คุณได้ระบุว่า category คือชนิดข้อมูลที่ถูกต้องสำหรับ user_type และแปลงชนิดข้อมูลเพื่อดึงสถิติสรุปที่ช่วยให้เข้าใจการกระจายตัวของ user_type

ปัญหาชนิดข้อมูลที่พบบ่อยอีกประเภทหนึ่งคือการนำเข้าค่าที่ควรเป็นตัวเลขในรูปแบบสตริง เพราะการดำเนินการทางคณิตศาสตร์ เช่น การบวกหรือการคูณ จะทำให้ได้ผลลัพธ์เป็นการเชื่อมต่อสตริง แทนที่จะเป็นค่าตัวเลข

ในแบบฝึกหัดนี้ คุณจะแปลงคอลัมน์สตริง duration ให้เป็นชนิด int แต่ก่อนอื่น ต้องตัดคำว่า "minutes" ออกจากคอลัมน์ก่อน เพื่อให้ pandas อ่านค่าเหล่านั้นเป็นตัวเลขได้ถูกต้อง โดย pandas ได้ถูก import มาแล้วในชื่อ pd

คำแนะนำ

100 XP
  • ใช้เมธอด .strip() เพื่อตัดคำว่า "minutes" ออกจาก duration แล้วเก็บผลลัพธ์ไว้ในคอลัมน์ duration_trim
  • แปลง duration_trim เป็น int แล้วเก็บไว้ในคอลัมน์ duration_time
  • เขียนคำสั่ง assert เพื่อตรวจสอบว่า ชนิดข้อมูลของ duration_time เป็น int แล้ว
  • แสดงค่าเฉลี่ยระยะเวลาการเดินทาง