MulaiMulai sekarang secara gratis

Mengelompokkan data ikan

Sekarang Anda akan menggunakan pipeline standarisasi dan pengelompokan dari latihan sebelumnya untuk mengelompokkan ikan berdasarkan ukurannya, lalu membuat tabel silang untuk membandingkan label klaster dengan spesies ikan.

Seperti sebelumnya, samples adalah array 2D berisi pengukuran ikan. Pipeline Anda tersedia sebagai pipeline, dan spesies dari setiap sampel ikan diberikan oleh daftar species.

Latihan ini adalah bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Petunjuk latihan

  • Impor pandas sebagai pd.
  • Sesuaikan pipeline pada pengukuran ikan samples.
  • Peroleh label klaster untuk samples dengan menggunakan metode .predict() dari pipeline.
  • Dengan pd.DataFrame(), buat DataFrame df dengan dua kolom bernama 'labels' dan 'species', masing-masing menggunakan labels dan species sebagai nilai kolom.
  • Dengan pd.crosstab(), buat tabel silang ct dari df['labels'] dan df['species'].

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Edit dan Jalankan Kode