1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Unsupervised Learning bằng Python

Connected

Bài tập

Phân cụm dữ liệu cá

Bây giờ bạn sẽ dùng pipeline chuẩn hóa và phân cụm từ bài trước để phân cụm các mẫu cá theo số đo của chúng, sau đó tạo một bảng chéo để so sánh nhãn cụm với loài cá.

Như trước, samples là mảng 2D chứa các số đo của cá. Pipeline của bạn có sẵn dưới tên pipeline, và loài của mỗi mẫu cá được cho bởi danh sách species.

Hướng dẫn

100 XP
  • Import pandas với bí danh pd.
  • Fit pipeline vào dữ liệu số đo cá samples.
  • Lấy nhãn cụm cho samples bằng phương thức .predict() của pipeline.
  • Dùng pd.DataFrame() để tạo DataFrame df với hai cột tên 'labels' và 'species', sử dụng labels và species tương ứng làm giá trị cột.
  • Dùng pd.crosstab() để tạo bảng chéo ct từ df['labels'] và df['species'].