MulaiMulai sekarang secara gratis

Menskalakan data ikan untuk klastering

Anda diberikan sebuah array samples yang berisi pengukuran ikan. Setiap baris mewakili satu ikan. Pengukuran seperti berat dalam gram, panjang dalam sentimeter, dan persentase rasio tinggi terhadap panjang memiliki skala yang sangat berbeda. Agar dapat mengelompokkan data ini secara efektif, Anda perlu melakukan standardisasi fitur-fitur tersebut terlebih dahulu. Pada latihan ini, Anda akan membangun sebuah pipeline untuk menstandarkan dan mengklasterkan data.

Data pengukuran ikan ini bersumber dari Journal of Statistics Education.

Latihan ini adalah bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Petunjuk latihan

  • Impor:
    • make_pipeline dari sklearn.pipeline.
    • StandardScaler dari sklearn.preprocessing.
    • KMeans dari sklearn.cluster.
  • Buat instans StandardScaler bernama scaler.
  • Buat instans KMeans dengan 4 klaster bernama kmeans.
  • Buat pipeline bernama pipeline yang merangkai scaler dan kmeans. Untuk melakukannya, cukup berikan keduanya sebagai argumen ke make_pipeline().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____

# Create scaler: scaler
scaler = ____

# Create KMeans instance: kmeans
kmeans = ____

# Create pipeline: pipeline
pipeline = ____
Edit dan Jalankan Kode