Menskalakan data ikan untuk klastering
Anda diberikan sebuah array samples yang berisi pengukuran ikan. Setiap baris mewakili satu ikan. Pengukuran seperti berat dalam gram, panjang dalam sentimeter, dan persentase rasio tinggi terhadap panjang memiliki skala yang sangat berbeda. Agar dapat mengelompokkan data ini secara efektif, Anda perlu melakukan standardisasi fitur-fitur tersebut terlebih dahulu. Pada latihan ini, Anda akan membangun sebuah pipeline untuk menstandarkan dan mengklasterkan data.
Data pengukuran ikan ini bersumber dari Journal of Statistics Education.
Latihan ini adalah bagian dari kursus
Unsupervised Learning in Python
Petunjuk latihan
- Impor:
make_pipelinedarisklearn.pipeline.StandardScalerdarisklearn.preprocessing.KMeansdarisklearn.cluster.
- Buat instans
StandardScalerbernamascaler. - Buat instans
KMeansdengan4klaster bernamakmeans. - Buat pipeline bernama
pipelineyang merangkaiscalerdankmeans. Untuk melakukannya, cukup berikan keduanya sebagai argumen kemake_pipeline().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____