Mise à l'échelle des données sur les poissons pour le regroupement
On vous fournit un tableau d'samples
s contenant les mensurations de poissons. Chaque ligne représente un poisson individuel. Les mesures, telles que le poids en grammes, la longueur en centimètres et le rapport entre la hauteur et la longueur, ont des échelles très différentes. Afin de regrouper efficacement ces données, il est nécessaire de normaliser ces caractéristiques au préalable. Dans cet exercice, vous allez créer un pipeline pour normaliser et regrouper les données.
Ces données relatives à la mesure des poissons proviennent du Journal of Statistics Education.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
Importation :
make_pipeline
Extrait desklearn.pipeline
.StandardScaler
Extrait desklearn.preprocessing
.KMeans
Extrait desklearn.cluster
.
Veuillez créer une instance d'
StandardScaler
nomméescaler
.Créez une instance de
KMeans
avec des clusters4
appeléskmeans
.Veuillez créer un pipeline nommé «
pipeline
» qui enchaîne «scaler
» et «kmeans
». Pour ce faire, il vous suffit de les passer en tant qu'arguments àmake_pipeline()
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____