1. Apprendre
  2. /
  3. Cours
  4. /
  5. Unsupervised Learning in Python

Connected

Exercice

Regrouper les données sur les poissons

Vous allez maintenant réutiliser votre pipeline de normalisation et de regroupement de l'exercice précédent pour regrouper les poissons selon leurs mesures, puis créer une table croisée afin de comparer les étiquettes de clusters aux espèces de poissons.

Comme précédemment, samples est le tableau 2D des mesures des poissons. Votre pipeline est disponible sous le nom pipeline, et l'espèce de chaque échantillon de poisson est fournie par la liste species.

Instructions

100 XP
  • Importez pandas sous le nom pd.
  • Ajustez le pipeline aux mesures des poissons samples.
  • Obtenez les étiquettes de clusters pour samples à l'aide de la méthode .predict() de pipeline.
  • Avec pd.DataFrame(), créez un DataFrame df comportant deux colonnes nommées 'labels' et 'species', en utilisant respectivement labels et species comme valeurs de colonnes.
  • Avec pd.crosstab(), créez une table croisée ct de df['labels'] et df['species'].