1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Unsupervised Learning bằng Python

Connected

Bài tập

Trích xuất nhãn cụm

Trong bài trước, bạn đã thấy rằng phép phân cụm trung gian của các mẫu hạt tại độ cao 6 có 3 cụm. Bây giờ, hãy dùng hàm fcluster() để trích xuất các nhãn cụm cho phép phân cụm trung gian này, và so sánh các nhãn với giống hạt bằng một bảng chéo.

Phân cụm phân cấp đã được thực hiện và mergings là kết quả của hàm linkage(). Danh sách varieties cho biết giống của từng mẫu hạt.

Hướng dẫn

100 XP
  • Import:
    • pandas với bí danh pd.
    • fcluster từ scipy.cluster.hierarchy.
  • Thực hiện phân cụm phân cấp phẳng bằng cách dùng hàm fcluster() trên mergings. Chỉ định độ cao tối đa là 6 và tham số từ khóa criterion='distance'.
  • Tạo DataFrame df với hai cột tên 'labels' và 'varieties', lần lượt dùng labels và varieties làm giá trị cột. Việc này đã được làm sẵn cho bạn.
  • Tạo bảng chéo ct giữa df['labels'] và df['varieties'] để đếm số lần mỗi giống hạt trùng với từng nhãn cụm.