Erste SchritteKostenlos loslegen

Clustering der Fischdaten

Du verwendest jetzt deine Standardisierungs- und Clustering-Pipeline aus der vorherigen Übung, um die Fische nach ihren Maßen zu clustern, und erstellst dann eine Kreuztabelle, um die Clusterbeschriftungen mit den Fischarten zu vergleichen.

Wie zuvor ist samples das 2D-Array der Fischmessungen. Deine Pipeline ist als pipeline verfügbar, und die Arten der einzelnen Fischproben sind in der Liste species aufgeführt.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere pandas als pd.
  • Passe die Rohrleitung an die Fischmaße samples an.
  • Erhalte die Cluster-Labels für samples mit Hilfe der .predict() Methode von pipeline.
  • Erstelle mit pd.DataFrame() einen DataFrame df mit zwei Spalten namens 'labels' und 'species' und verwende labels bzw. species für die Spaltenwerte.
  • Erstelle mit pd.crosstab() eine Kreuztabelle ct aus df['labels'] und df['species'].

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Bearbeiten und Ausführen von Code