1. 학습
  2. /
  3. 강의
  4. /
  5. Unsupervised Learning bằng Python

Connected

연습 문제

Chuẩn hóa dữ liệu cá để phân cụm

Bạn được cung cấp một mảng samples chứa các phép đo của cá. Mỗi hàng tương ứng với một cá thể. Các phép đo, như cân nặng tính bằng gram, chiều dài tính bằng cm, và tỷ lệ phần trăm giữa chiều cao so với chiều dài, có thang đo rất khác nhau. Để phân cụm dữ liệu này hiệu quả, trước hết bạn cần chuẩn hóa các đặc trưng này. Trong bài tập này, bạn sẽ xây dựng một pipeline để chuẩn hóa và phân cụm dữ liệu.

Dữ liệu đo đạc cá này được lấy từ Journal of Statistics Education.

지침

100 XP
  • Import:
    • make_pipeline từ sklearn.pipeline.
    • StandardScaler từ sklearn.preprocessing.
    • KMeans từ sklearn.cluster.
  • Tạo một thể hiện StandardScaler tên là scaler.
  • Tạo một thể hiện KMeans với 4 cụm tên là kmeans.
  • Tạo một pipeline tên pipeline để xâu chuỗi scaler và kmeans. Để làm điều này, bạn chỉ cần truyền chúng làm đối số cho make_pipeline().