LoslegenKostenlos loslegen

Fischdaten clustern

Jetzt verwendest du deine Standardisierungs- und Clustering-Pipeline aus der vorherigen Übung, um die Fische anhand ihrer Messwerte zu clustern, und erstellst anschließend eine Kreuztabelle, um die Cluster-Labels mit den Fischarten zu vergleichen.

Wie zuvor ist samples das 2D-Array mit den Fischmessungen. Deine Pipeline ist als pipeline verfügbar, und die Art jeder Fischprobe steht in der Liste species.

Diese Übung ist Teil des Kurses

Unsupervised Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere pandas als pd.
  • Passe die Pipeline an die Fischmessungen (samples) an.
  • Ermittle die Cluster-Labels für samples mit der Methode .predict() von pipeline.
  • Erstelle mit pd.DataFrame() ein DataFrame df mit zwei Spalten namens 'labels' und 'species' und verwende dafür labels bzw. species als Spaltenwerte.
  • Erstelle mit pd.crosstab() eine Kreuztabelle ct aus df['labels'] und df['species'].

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Code bearbeiten und ausführen