1. Learn
  2. /
  3. Курси
  4. /
  5. Unsupervised Learning in Python

Connected

вправа

Regrouper des actions avec KMeans

Dans cet exercice, vous allez regrouper des entreprises à partir des variations quotidiennes de leurs cours boursiers (c.-à-d. la différence en dollars entre le cours de clôture et le cours d'ouverture pour chaque jour de bourse). On vous fournit un tableau NumPy movements des variations quotidiennes de 2010 à 2015 (provenant de Yahoo! Finance), où chaque ligne correspond à une entreprise et chaque colonne à un jour de bourse.

Certaines actions coûtent plus cher que d'autres. Pour en tenir compte, incluez un Normalizer au début de votre pipeline. Le Normalizer transformera séparément le cours de chaque entreprise sur une échelle relative avant de lancer le regroupement.

Notez que Normalizer() est différent de StandardScaler(), que vous avez utilisé dans l'exercice précédent. Alors que StandardScaler() normalise les caractéristiques (comme celles des données sur les poissons de l'exercice précédent) en retirant la moyenne et en mettant à l'échelle selon une variance unitaire, Normalizer() remet à l'échelle chaque échantillon — ici, le cours de chaque entreprise — indépendamment des autres.

KMeans et make_pipeline ont déjà été importés pour vous.

Інструкції

100 XP
  • Importez Normalizer depuis sklearn.preprocessing.
  • Créez une instance de Normalizer appelée normalizer.
  • Créez une instance de KMeans appelée kmeans avec 10 groupes.
  • À l'aide de make_pipeline(), créez un pipeline appelé pipeline qui enchaîne normalizer et kmeans.
  • Ajustez le pipeline au tableau movements.