Regroupement des actions à l'aide de KMeans
Dans cet exercice, vous allez regrouper des entreprises en fonction de l'évolution quotidienne du cours de leurs actions (c'est-à-dire la différence en dollars entre le cours de clôture et le cours d'ouverture pour chaque jour de bourse). Vous disposez d'un tableau NumPy « movements » contenant l'évolution quotidienne des cours entre 2010 et 2015 (obtenu auprès de Yahoo! Finance), où chaque ligne correspond à une entreprise et chaque colonne à un jour de bourse.
Certaines actions sont plus chères que d'autres. Pour tenir compte de cela, incluez un « Normalizer » au début de votre pipeline. Le Normalizer transformera séparément le cours de l'action de chaque entreprise à une échelle relative avant que le regroupement ne commence.
Veuillez noter que « Normalizer() » est différent de « StandardScaler() », que vous avez utilisé dans l'exercice précédent. Alors que StandardScaler() normalise les caractéristiques (telles que les caractéristiques des données sur les poissons de l'exercice précédent) en supprimant la moyenne et en les mettant à l'échelle de la variance unitaire, Normalizer() remet à l'échelle chaque échantillon - ici, le cours de l'action de chaque entreprise - indépendamment des autres.
KMeans et make_pipeline ont déjà été importés pour vous.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importez « Normalizer » depuis « sklearn.preprocessing ».
- Créez une instance de « Normalizer » appelée « normalizer ».
- Créez une instance de « KMeans » appelée « kmeans » avec « 10 » clusters.
- À l'aide de « make_pipeline() », créez un pipeline appelé « pipeline » qui enchaîne « normalizer » et « kmeans ».
- Adaptez le pipeline au tableau « movements ».
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import Normalizer
____
# Create a normalizer: normalizer
normalizer = ____
# Create a KMeans model with 10 clusters: kmeans
kmeans = ____
# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____
# Fit pipeline to the daily price movements
____