Die Fischdaten gruppieren
Jetzt wirst du deine Standardisierungs- und Clustering-Pipeline aus der letzten Übung nutzen, um die Fische nach ihren Maßen zu gruppieren und dann eine Kreuztabelle erstellen, um die Cluster-Bezeichnungen mit den Fischarten zu vergleichen.
Wie vorher ist „ samples
” das 2D-Array mit den Fischmessungen. Deine Pipeline findest du unter pipeline
und die Fischarten in jeder Probe sind in der Liste species
aufgelistet.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
pandas
alspd
. - Passe die Rohrleitung an die Maße der Fische an
samples
. - Hol dir die Cluster-Labels für „
samples
“, indem du die Methode „.predict()
“ von „pipeline
“ benutzt. - Erstell mit „
pd.DataFrame()
“ einen DataFrame „df
“ mit zwei Spalten namens „'labels'
“ und „'species'
“, wobei du für die Spaltenwerte „labels
“ und „species
“ verwendest. - Erstell mit „
pd.crosstab()
“ eine Kreuztabelle „ct
“ aus „df['labels']
“ und „df['species']
“.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)