Mengekstrak label klaster
Pada latihan sebelumnya, Anda melihat bahwa pengelompokan sementara sampel gandum pada ketinggian 6 memiliki 3 klaster. Sekarang, gunakan fungsi fcluster() untuk mengekstrak label klaster dari pengelompokan sementara ini, lalu bandingkan label tersebut dengan varietas gandum menggunakan tabulasi silang.
Hierarchical clustering telah dilakukan dan mergings adalah hasil dari fungsi linkage(). Daftar varieties memberikan varietas untuk setiap sampel gandum.
Latihan ini adalah bagian dari kursus
Unsupervised Learning in Python
Petunjuk latihan
- Impor:
pandassebagaipd.fclusterdariscipy.cluster.hierarchy.
- Lakukan flat hierarchical clustering dengan menggunakan fungsi
fcluster()padamergings. Tentukan tinggi maksimum6dan argumen kata kuncicriterion='distance'. - Buat DataFrame
dfdengan dua kolom bernama'labels'dan'varieties', masing-masing menggunakanlabelsdanvarietiessebagai nilai kolom. Ini telah disiapkan untuk Anda. - Buat tabulasi silang
ctantaradf['labels']dandf['varieties']untuk menghitung frekuensi setiap varietas gandum pada setiap label klaster.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Perform the necessary imports
import ____ as ____
from ____ import ____
# Use fcluster to extract labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)