Mengelompokkan data ikan
Sekarang Anda akan menggunakan pipeline standarisasi dan pengelompokan dari latihan sebelumnya untuk mengelompokkan ikan berdasarkan ukurannya, lalu membuat tabel silang untuk membandingkan label klaster dengan spesies ikan.
Seperti sebelumnya, samples adalah array 2D berisi pengukuran ikan. Pipeline Anda tersedia sebagai pipeline, dan spesies dari setiap sampel ikan diberikan oleh daftar species.
Latihan ini merupakan bagian dari kursus
Unsupervised Learning in Python
Instruksi latihan
- Impor
pandassebagaipd. - Sesuaikan pipeline pada pengukuran ikan
samples. - Peroleh label klaster untuk
samplesdengan menggunakan metode.predict()daripipeline. - Dengan
pd.DataFrame(), buat DataFramedfdengan dua kolom bernama'labels'dan'species', masing-masing menggunakanlabelsdanspeciessebagai nilai kolom. - Dengan
pd.crosstab(), buat tabel silangctdaridf['labels']dandf['species'].
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)