Aan de slagGa gratis aan de slag

Clusteren van de visgegevens

Je gaat nu je standaardiseer- en clustering-pipeline uit de vorige oefening gebruiken om de vissen te clusteren op basis van hun metingen, en vervolgens een kruistabel maken om de clusterlabels te vergelijken met de vissensoorten.

Zoals eerder is samples de 2D-array met vismetingen. Je pipeline is beschikbaar als pipeline, en de soort van elke vis is gegeven door de lijst species.

Deze oefening maakt deel uit van de cursus

Unsupervised Learning in Python

Cursus bekijken

Oefeninstructies

  • Importeer pandas als pd.
  • Train de pipeline op de vismetingen samples.
  • Haal de clusterlabels voor samples op met de methode .predict() van pipeline.
  • Maak met pd.DataFrame() een DataFrame df met twee kolommen genaamd 'labels' en 'species', waarbij je respectievelijk labels en species gebruikt als kolomwaarden.
  • Maak met pd.crosstab() een kruistabel ct van df['labels'] en df['species'].

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Code bewerken en uitvoeren