Fischdaten clustern
Jetzt verwendest du deine Standardisierungs- und Clustering-Pipeline aus der vorherigen Übung, um die Fische anhand ihrer Messwerte zu clustern, und erstellst anschließend eine Kreuztabelle, um die Cluster-Labels mit den Fischarten zu vergleichen.
Wie zuvor ist samples das 2D-Array mit den Fischmessungen. Deine Pipeline ist als pipeline verfügbar, und die Art jeder Fischprobe steht in der Liste species.
Diese Übung ist Teil des Kurses
<Kurs>Unsupervised Learning in Python</Kurs>Übungsanweisungen
- Importiere
pandasalspd. - Passe die Pipeline an die Fischmessungen (
samples) an. - Ermittle die Cluster-Labels für
samplesmit der Methode.predict()vonpipeline. - Erstelle mit
pd.DataFrame()ein DataFramedfmit zwei Spalten namens'labels'und'species'und verwende dafürlabelsbzw.speciesals Spaltenwerte. - Erstelle mit
pd.crosstab()eine Kreuztabellectausdf['labels']unddf['species'].
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)