Regroupement des données sur les poissons
Vous allez maintenant utiliser votre pipeline de normalisation et de regroupement de l'exercice précédent pour regrouper les poissons en fonction de leurs mesures, puis créer un tableau croisé pour comparer les étiquettes des groupes avec les espèces de poissons.
Comme précédemment, « samples
» est le tableau 2D des mesures des poissons. Votre pipeline est disponible à l'adresse pipeline
, et l'espèce de chaque échantillon de poisson est indiquée dans la liste species
.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importez
pandas
en tant quepd
. - Ajustez le pipeline aux mesures du poisson.
samples
. - Obtenez les étiquettes de cluster pour
samples
en utilisant la méthode.predict()
depipeline
. - À l'aide d'
pd.DataFrame()
, créez un DataFramedf
avec deux colonnes nommées'labels'
et'species'
, en utilisant respectivementlabels
etspecies
pour les valeurs des colonnes. - À l'aide de
pd.crosstab()
, créez un tableau croiséct
dedf['labels']
etdf['species']
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)