CommencerCommencer gratuitement

Regroupement de titres à l'aide de KMeans

Dans cet exercice, vous regrouperez des entreprises en fonction de l'évolution quotidienne du cours de leurs actions (c'est-à-dire la différence en dollars entre le cours de clôture et le cours d'ouverture de chaque jour de bourse). On vous fournit un tableau NumPy movements contenant les fluctuations quotidiennes des cours entre 2010 et 2015 (obtenu à partir de Yahoo! Finance), où chaque ligne correspond à une entreprise et chaque colonne correspond à un jour de bourse.

Certaines actions sont plus chères que d'autres. Pour tenir compte de cela, veuillez inclure un « Normalizer » au début de votre pipeline. Le normalisateur transformera séparément le cours de l'action de chaque entreprise en une échelle relative avant le début du regroupement.

Veuillez noter que Normalizer() est différent de StandardScaler(), que vous avez utilisé dans l'exercice précédent. Alors que l'StandardScaler() normalise les caractéristiques (telles que les caractéristiques des données sur les poissons de l'exercice précédent) en supprimant la moyenne et en les ramenant à une variance unitaire, l'Normalizer() redimensionne chaque échantillon (ici, le cours de l'action de chaque entreprise) indépendamment des autres.

KMeans make_pipeline ont déjà été importés pour vous.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Importez Normalizer à partir de sklearn.preprocessing.
  • Veuillez créer une instance d'Normalizer nommée normalizer.
  • Veuillez créer une instance d'KMeans nommée « kmeans » avec des clusters « 10 ».
  • À l'aide de make_pipeline(), veuillez créer un pipeline nommé « pipeline » qui enchaîne « normalizer » et « kmeans ».
  • Ajustez le pipeline à la matrice d'movements.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import Normalizer
____

# Create a normalizer: normalizer
normalizer = ____

# Create a KMeans model with 10 clusters: kmeans
kmeans = ____

# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____

# Fit pipeline to the daily price movements
____
Modifier et exécuter le code