CommencerCommencer gratuitement

Mise à l'échelle des données sur les poissons pour le regroupement

On vous fournit un tableau « samples » contenant les mesures de poissons. Chaque ligne représente un poisson individuel. Les mesures, telles que le poids en grammes, la longueur en centimètres et le rapport pourcentage entre la hauteur et la longueur, ont des échelles très différentes. Afin de regrouper efficacement ces données, il est nécessaire de normaliser ces caractéristiques au préalable. Dans cet exercice, vous allez créer un pipeline pour normaliser et regrouper les données.

Ces données de mesure des poissons proviennent du Journal of Statistics Education.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Importez :
    • make_pipeline depuis sklearn.pipeline.
    • StandardScaler depuis sklearn.preprocessing.
    • KMeans depuis sklearn.cluster.
  • Créez une instance de StandardScaler nommée scaler.
  • Créer une instance de KMeans avec 4 clusters appelée kmeans.
  • Créer un pipeline appelé pipeline qui enchaîne scaler et kmeans. Pour ce faire, il suffit de les passer en tant qu'arguments à make_pipeline().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____

# Create scaler: scaler
scaler = ____

# Create KMeans instance: kmeans
kmeans = ____

# Create pipeline: pipeline
pipeline = ____
Modifier et exécuter le code