MulaiMulai sekarang secara gratis

Mengekstrak label klaster

Pada latihan sebelumnya, Anda melihat bahwa pengelompokan sementara sampel gandum pada ketinggian 6 memiliki 3 klaster. Sekarang, gunakan fungsi fcluster() untuk mengekstrak label klaster dari pengelompokan sementara ini, lalu bandingkan label tersebut dengan varietas gandum menggunakan tabulasi silang.

Hierarchical clustering telah dilakukan dan mergings adalah hasil dari fungsi linkage(). Daftar varieties memberikan varietas untuk setiap sampel gandum.

Latihan ini adalah bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Petunjuk latihan

  • Impor:
    • pandas sebagai pd.
    • fcluster dari scipy.cluster.hierarchy.
  • Lakukan flat hierarchical clustering dengan menggunakan fungsi fcluster() pada mergings. Tentukan tinggi maksimum 6 dan argumen kata kunci criterion='distance'.
  • Buat DataFrame df dengan dua kolom bernama 'labels' dan 'varieties', masing-masing menggunakan labels dan varieties sebagai nilai kolom. Ini telah disiapkan untuk Anda.
  • Buat tabulasi silang ct antara df['labels'] dan df['varieties'] untuk menghitung frekuensi setiap varietas gandum pada setiap label klaster.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Edit dan Jalankan Kode