LoslegenKostenlos starten

Cluster-Labels extrahieren

In der vorherigen Übung hast du gesehen, dass die Zwischenstufe des Clusterings der Getreideproben auf Höhe 6 drei Cluster hat. Verwende nun die Funktion fcluster(), um die Cluster-Labels für dieses Zwischen-Clustering zu extrahieren, und vergleiche die Labels mit den Getreidesorten mithilfe einer Kreuztabelle.

Das hierarchische Clustering wurde bereits durchgeführt, und mergings ist das Ergebnis der Funktion linkage(). Die Liste varieties gibt die Sorte jeder Getreideprobe an.

Diese Übung ist Teil des Kurses

<Kurs>Unsupervised Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere:
    • pandas als pd.
    • fcluster aus scipy.cluster.hierarchy.
  • Führe ein flaches hierarchisches Clustering durch, indem du fcluster() auf mergings anwendest. Gib eine maximale Höhe von 6 und das Schlüsselwortargument criterion='distance' an.
  • Erstelle einen DataFrame df mit zwei Spalten namens 'labels' und 'varieties', wobei du für die Spaltenwerte jeweils labels bzw. varieties verwendest. Das wurde bereits für dich erledigt.
  • Erstelle eine Kreuztabelle ct zwischen df['labels'] und df['varieties'], um zu zählen, wie oft jede Getreidesorte mit jedem Cluster-Label zusammenfällt.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Perform the necessary imports
import ____ as ____
from ____ import ____

# Use fcluster to extract labels: labels
labels = ____

# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Code bearbeiten und ausführen