CommencerCommencer gratuitement

Mise à l'échelle des données sur les poissons pour le regroupement

On vous fournit un tableau d'samples s contenant les mensurations de poissons. Chaque ligne représente un poisson individuel. Les mesures, telles que le poids en grammes, la longueur en centimètres et le rapport entre la hauteur et la longueur, ont des échelles très différentes. Afin de regrouper efficacement ces données, il est nécessaire de normaliser ces caractéristiques au préalable. Dans cet exercice, vous allez créer un pipeline pour normaliser et regrouper les données.

Ces données relatives à la mesure des poissons proviennent du Journal of Statistics Education.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Importation :

    • make_pipeline Extrait de sklearn.pipeline.

    • StandardScaler Extrait de sklearn.preprocessing.

    • KMeans Extrait de sklearn.cluster.

  • Veuillez créer une instance d'StandardScaler nommée scaler.

  • Créez une instance de KMeans avec des clusters 4 appelés kmeans.

  • Veuillez créer un pipeline nommé « pipeline » qui enchaîne « scaler » et « kmeans ». Pour ce faire, il vous suffit de les passer en tant qu'arguments à make_pipeline().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____

# Create scaler: scaler
scaler = ____

# Create KMeans instance: kmeans
kmeans = ____

# Create pipeline: pipeline
pipeline = ____
Modifier et exécuter le code