Mengelompokkan data ikan
Sekarang Anda akan menggunakan pipeline standarisasi dan pengelompokan dari latihan sebelumnya untuk mengelompokkan ikan berdasarkan ukurannya, lalu membuat tabel silang untuk membandingkan label klaster dengan spesies ikan.
Seperti sebelumnya, samples adalah array 2D berisi pengukuran ikan. Pipeline Anda tersedia sebagai pipeline, dan spesies dari setiap sampel ikan diberikan oleh daftar species.
Latihan ini adalah bagian dari kursus
Unsupervised Learning in Python
Petunjuk latihan
- Impor
pandassebagaipd. - Sesuaikan pipeline pada pengukuran ikan
samples. - Peroleh label klaster untuk
samplesdengan menggunakan metode.predict()daripipeline. - Dengan
pd.DataFrame(), buat DataFramedfdengan dua kolom bernama'labels'dan'species', masing-masing menggunakanlabelsdanspeciessebagai nilai kolom. - Dengan
pd.crosstab(), buat tabel silangctdaridf['labels']dandf['species'].
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)