1. Learn
  2. /
  3. Kurser
  4. /
  5. Oövervakad inlärning i Python

Connected

övning

Klustra aktier med KMeans

I den här övningen ska du klustra företag utifrån deras dagliga aktiekursrörelser – det vill säga skillnaden i dollar mellan stängnings- och öppningskursen för varje handelsdag. Du får ett NumPy-array movements med dagliga kursrörelser från 2010 till 2015 (hämtade från Yahoo! Finance), där varje rad motsvarar ett företag och varje kolumn en handelsdag.

En del aktier är dyrare än andra. För att ta hänsyn till det ska du lägga till en Normalizer i början av din pipeline. Normalizer transformerar varje företags aktiekurs till en relativ skala innan klustringsprocessen startar.

Observera att Normalizer() skiljer sig från StandardScaler(), som du använde i föregående övning. Medan StandardScaler() standardiserar särdrag (som särdragen i fiskladdatan från förra övningen) genom att ta bort medelvärdet och skala till enhetsvariation, skalar Normalizer() om varje urval – här varje företags aktiekurs – oberoende av de andra.

KMeans och make_pipeline har redan importerats åt dig.

Instruktioner

100 XP
  • Importera Normalizer från sklearn.preprocessing.
  • Skapa en instans av Normalizer och kalla den normalizer.
  • Skapa en instans av KMeans och kalla den kmeans med 10 kluster.
  • Använd make_pipeline() för att skapa en pipeline som heter pipeline och kopplar samman normalizer och kmeans.
  • Anpassa pipelinen till arrayen movements.