Clustering der Fischdaten
Du verwendest jetzt deine Standardisierungs- und Clustering-Pipeline aus der vorherigen Übung, um die Fische nach ihren Maßen zu clustern, und erstellst dann eine Kreuztabelle, um die Clusterbeschriftungen mit den Fischarten zu vergleichen.
Wie zuvor ist samples
das 2D-Array der Fischmessungen. Deine Pipeline ist als pipeline
verfügbar, und die Arten der einzelnen Fischproben sind in der Liste species
aufgeführt.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
pandas
alspd
. - Passe die Rohrleitung an die Fischmaße
samples
an. - Erhalte die Cluster-Labels für
samples
mit Hilfe der.predict()
Methode vonpipeline
. - Erstelle mit
pd.DataFrame()
einen DataFramedf
mit zwei Spalten namens'labels'
und'species'
und verwendelabels
bzw.species
für die Spaltenwerte. - Erstelle mit
pd.crosstab()
eine Kreuztabellect
ausdf['labels']
unddf['species']
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)