Menskalakan data ikan untuk klastering
Anda diberikan sebuah array samples yang berisi pengukuran ikan. Setiap baris mewakili satu ikan. Pengukuran seperti berat dalam gram, panjang dalam sentimeter, dan persentase rasio tinggi terhadap panjang memiliki skala yang sangat berbeda. Agar dapat mengelompokkan data ini secara efektif, Anda perlu melakukan standardisasi fitur-fitur tersebut terlebih dahulu. Pada latihan ini, Anda akan membangun sebuah pipeline untuk menstandarkan dan mengklasterkan data.
Data pengukuran ikan ini bersumber dari Journal of Statistics Education.
Latihan ini merupakan bagian dari kursus
Unsupervised Learning in Python
Instruksi latihan
- Impor:
make_pipelinedarisklearn.pipeline.StandardScalerdarisklearn.preprocessing.KMeansdarisklearn.cluster.
- Buat instans
StandardScalerbernamascaler. - Buat instans
KMeansdengan4klaster bernamakmeans. - Buat pipeline bernama
pipelineyang merangkaiscalerdankmeans. Untuk melakukannya, cukup berikan keduanya sebagai argumen kemake_pipeline().
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____