Mengekstrak label klaster
Pada latihan sebelumnya, Anda melihat bahwa pengelompokan sementara sampel gandum pada ketinggian 6 memiliki 3 klaster. Sekarang, gunakan fungsi fcluster() untuk mengekstrak label klaster dari pengelompokan sementara ini, lalu bandingkan label tersebut dengan varietas gandum menggunakan tabulasi silang.
Hierarchical clustering telah dilakukan dan mergings adalah hasil dari fungsi linkage(). Daftar varieties memberikan varietas untuk setiap sampel gandum.
Latihan ini merupakan bagian dari kursus
Unsupervised Learning in Python
Instruksi latihan
- Impor:
pandassebagaipd.fclusterdariscipy.cluster.hierarchy.
- Lakukan flat hierarchical clustering dengan menggunakan fungsi
fcluster()padamergings. Tentukan tinggi maksimum6dan argumen kata kuncicriterion='distance'. - Buat DataFrame
dfdengan dua kolom bernama'labels'dan'varieties', masing-masing menggunakanlabelsdanvarietiessebagai nilai kolom. Ini telah disiapkan untuk Anda. - Buat tabulasi silang
ctantaradf['labels']dandf['varieties']untuk menghitung frekuensi setiap varietas gandum pada setiap label klaster.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)