1. Learn
  2. /
  3. Courses
  4. /
  5. การใช้งาน Hugging Face

Connected

Exercise

การจัดการชุดข้อมูล

ในงาน ML มักจะต้องจัดการชุดข้อมูลก่อนนำไปใช้งานเสมอ การจัดการที่พบบ่อยได้แก่ การกรอง (filtering) และการเลือก (selecting หรือ slicing) เนื่องจากชุดข้อมูลเหล่านี้มีขนาดใหญ่ Hugging Face จึงใช้ไฟล์ประเภท Arrow

ซึ่งหมายความว่าวิธีการจัดการข้อมูลจะแตกต่างจากที่คุ้นเคยอยู่บ้าง แต่ไม่ต้องกังวล มีเมธอดพร้อมให้ใช้งานอยู่แล้ว!

ชุดข้อมูลถูกโหลดไว้ให้แล้วในตัวแปร wikipedia

Instructions 1/2

undefined XP
    1
    2
  • กรองชุดข้อมูลเพื่อดึงแถวที่มีคำว่า "football" ในคอลัมน์ text แล้วบันทึกผลลัพธ์ไว้ในตัวแปร filtered
  • เลือกตัวอย่างหนึ่งรายการจากชุดข้อมูลที่กรองแล้ว แล้วบันทึกไว้ในตัวแปร example