Regroupement de titres à l'aide de KMeans
Dans cet exercice, vous regrouperez des entreprises en fonction de l'évolution quotidienne du cours de leurs actions (c'est-à-dire la différence en dollars entre le cours de clôture et le cours d'ouverture de chaque jour de bourse). On vous fournit un tableau NumPy movements
contenant les fluctuations quotidiennes des cours entre 2010 et 2015 (obtenu à partir de Yahoo! Finance), où chaque ligne correspond à une entreprise et chaque colonne correspond à un jour de bourse.
Certaines actions sont plus chères que d'autres. Pour tenir compte de cela, veuillez inclure un « Normalizer
» au début de votre pipeline. Le normalisateur transformera séparément le cours de l'action de chaque entreprise en une échelle relative avant le début du regroupement.
Veuillez noter que Normalizer()
est différent de StandardScaler()
, que vous avez utilisé dans l'exercice précédent. Alors que l'StandardScaler()
normalise les caractéristiques (telles que les caractéristiques des données sur les poissons de l'exercice précédent) en supprimant la moyenne et en les ramenant à une variance unitaire, l'Normalizer()
redimensionne chaque échantillon (ici, le cours de l'action de chaque entreprise) indépendamment des autres.
KMeans
make_pipeline
ont déjà été importés pour vous.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importez
Normalizer
à partir desklearn.preprocessing
. - Veuillez créer une instance d'
Normalizer
nomméenormalizer
. - Veuillez créer une instance d'
KMeans
nommée «kmeans
» avec des clusters «10
». - À l'aide de
make_pipeline()
, veuillez créer un pipeline nommé «pipeline
» qui enchaîne «normalizer
» et «kmeans
». - Ajustez le pipeline à la matrice d'
movements
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import Normalizer
____
# Create a normalizer: normalizer
normalizer = ____
# Create a KMeans model with 10 clusters: kmeans
kmeans = ____
# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____
# Fit pipeline to the daily price movements
____