Mulai sekarangMulai gratis

Mengelompokkan data ikan

Sekarang Anda akan menggunakan pipeline standarisasi dan pengelompokan dari latihan sebelumnya untuk mengelompokkan ikan berdasarkan ukurannya, lalu membuat tabel silang untuk membandingkan label klaster dengan spesies ikan.

Seperti sebelumnya, samples adalah array 2D berisi pengukuran ikan. Pipeline Anda tersedia sebagai pipeline, dan spesies dari setiap sampel ikan diberikan oleh daftar species.

Latihan ini merupakan bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Instruksi latihan

  • Impor pandas sebagai pd.
  • Sesuaikan pipeline pada pengukuran ikan samples.
  • Peroleh label klaster untuk samples dengan menggunakan metode .predict() dari pipeline.
  • Dengan pd.DataFrame(), buat DataFrame df dengan dua kolom bernama 'labels' dan 'species', masing-masing menggunakan labels dan species sebagai nilai kolom.
  • Dengan pd.crosstab(), buat tabel silang ct dari df['labels'] dan df['species'].

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Edit dan Jalankan Kode