CommencerCommencer gratuitement

Regroupement des données sur les poissons

Vous allez maintenant utiliser votre pipeline de normalisation et de regroupement de l'exercice précédent pour regrouper les poissons en fonction de leurs mesures, puis créer un tableau croisé pour comparer les étiquettes des groupes avec les espèces de poissons.

Comme précédemment, « samples » est le tableau 2D des mesures des poissons. Votre pipeline est disponible à l'adresse pipeline, et l'espèce de chaque échantillon de poisson est indiquée dans la liste species.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Importez pandas en tant que pd.
  • Ajustez le pipeline aux mesures du poisson. samples.
  • Obtenez les étiquettes de cluster pour samples en utilisant la méthode .predict() de pipeline.
  • À l'aide d'pd.DataFrame(), créez un DataFrame df avec deux colonnes nommées 'labels' et 'species', en utilisant respectivement labels et species pour les valeurs des colonnes.
  • À l'aide de pd.crosstab(), créez un tableau croisé ct de df['labels'] et df['species'].

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Modifier et exécuter le code