1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การทำความสะอาดข้อมูลใน Python

Connected

แบบฝึกหัด

ข้อมูลตัวเลข หรือ ... ?

ในแบบฝึกหัดนี้และตลอดทั้งบทนี้ คุณจะได้ทำงานกับข้อมูลการแชร์จักรยานในซานฟรานซิสโก ชื่อว่า ride_sharing ซึ่งมีข้อมูลเกี่ยวกับสถานีต้นทางและปลายทาง ระยะเวลาของการเดินทาง รวมถึงข้อมูลผู้ใช้สำหรับบริการแชร์จักรยาน

คอลัมน์ user_type เก็บข้อมูลว่าผู้ใช้เป็นประเภทใด โดยมีค่าดังนี้:

  • 1 สำหรับผู้ใช้ที่ขี่ฟรี
  • 2 สำหรับผู้ใช้แบบจ่ายต่อครั้ง
  • 3 สำหรับผู้ใช้แบบรายเดือน

ในแบบฝึกหัดนี้ ให้ใช้ .info() เพื่อแสดงข้อมูลของ ride_sharing และสังเกตด้วยตนเองว่าชนิดข้อมูลที่ไม่ถูกต้องส่งผลต่อการวิเคราะห์ชุดข้อมูลอย่างไร โดย pandas ถูก import มาแล้วในชื่อ pd

คำแนะนำ 1/3

undefined XP
    1
    2
    3
  • แสดงข้อมูลของ ride_sharing
  • ใช้ .describe() เพื่อแสดง summary statistics ของคอลัมน์ user_type จาก ride_sharing