LoslegenKostenlos starten

Fischdaten clustern

Jetzt verwendest du deine Standardisierungs- und Clustering-Pipeline aus der vorherigen Übung, um die Fische anhand ihrer Messwerte zu clustern, und erstellst anschließend eine Kreuztabelle, um die Cluster-Labels mit den Fischarten zu vergleichen.

Wie zuvor ist samples das 2D-Array mit den Fischmessungen. Deine Pipeline ist als pipeline verfügbar, und die Art jeder Fischprobe steht in der Liste species.

Diese Übung ist Teil des Kurses

<Kurs>Unsupervised Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere pandas als pd.
  • Passe die Pipeline an die Fischmessungen (samples) an.
  • Ermittle die Cluster-Labels für samples mit der Methode .predict() von pipeline.
  • Erstelle mit pd.DataFrame() ein DataFrame df mit zwei Spalten namens 'labels' und 'species' und verwende dafür labels bzw. species als Spaltenwerte.
  • Erstelle mit pd.crosstab() eine Kreuztabelle ct aus df['labels'] und df['species'].

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Code bearbeiten und ausführen