1. Learn
  2. /
  3. 课程
  4. /
  5. Unsupervised Learning in Python

Connected

道练习

Clustering akcií pomocí KMeans

V tomto cvičení budeš shlukovat společnosti podle denních pohybů cen jejich akcií (tj. rozdílu v dolarech mezi zavírací a otevírací cenou pro každý obchodní den). Máš k dispozici NumPy pole movements s denními cenovými pohyby za období 2010–2015 (získaná z Yahoo! Finance), kde každý řádek odpovídá jedné společnosti a každý sloupec jednomu obchodnímu dni.

Některé akcie jsou dražší než jiné. Aby ses s tím vypořádal/a, zařaď na začátek pipeline Normalizer. Ten před zahájením clusteringu samostatně převede cenu akcií každé společnosti na relativní škálu.

Povšimni si, že Normalizer() se liší od StandardScaler(), který jsi použil/a v předchozím cvičení. Zatímco StandardScaler() standardizuje příznaky (například příznaky z dat o rybách z předchozího cvičení) odečtením průměru a škálováním na jednotkový rozptyl, Normalizer() přeškáluje každý vzorek – zde cenu akcií každé společnosti – nezávisle na ostatních.

KMeans a make_pipeline už jsou za tebe naimportované.

说明

100 XP
  • Importuj Normalizer z sklearn.preprocessing.
  • Vytvoř instanci Normalizer s názvem normalizer.
  • Vytvoř instanci KMeans s názvem kmeans a 10 clustery.
  • Pomocí make_pipeline() vytvoř pipeline s názvem pipeline, která spojuje normalizer a kmeans.
  • Natrénuj pipeline na poli movements.