1. Learn
  2. /
  3. คอร์ส
  4. /
  5. Unsupervised Learning ใน Python

Connected

แบบฝึกหัด

การจัดกลุ่มข้อมูลปลา

ในแบบฝึกหัดนี้ จะใช้ pipeline สำหรับการทำ standardization และ clustering จากแบบฝึกหัดก่อนหน้า เพื่อจัดกลุ่มปลาตามข้อมูลการวัด จากนั้นสร้าง cross-tabulation เพื่อเปรียบเทียบ cluster labels กับสายพันธุ์ของปลา

เช่นเดิม samples คืออาร์เรย์ 2 มิติของข้อมูลการวัดปลา pipeline พร้อมใช้งานในตัวแปร pipeline และสายพันธุ์ของปลาแต่ละตัวอยู่ใน list species

คำแนะนำ

100 XP
  • นำเข้า pandas โดยใช้ชื่อแทนว่า pd
  • Fit pipeline กับข้อมูลการวัดปลา samples
  • ดึง cluster labels ของ samples โดยใช้เมธอด .predict() ของ pipeline
  • ใช้ pd.DataFrame() สร้าง DataFrame ชื่อ df ที่มี 2 คอลัมน์ชื่อ 'labels' และ 'species' โดยใช้ labels และ species เป็นค่าของแต่ละคอลัมน์ตามลำดับ
  • ใช้ pd.crosstab() สร้าง cross-tabulation ชื่อ ct จาก df['labels'] และ df['species']