1. Apprendre
  2. /
  3. Cours
  4. /
  5. Unsupervised Learning in Python

Connected

Exercice

Hiérarchies de titres boursiers

Au chapitre 1, vous avez utilisé le regroupement k-means pour regrouper des entreprises selon les variations de leurs cours boursiers. Vous allez maintenant effectuer un regroupement hiérarchique des entreprises. On vous fournit un tableau NumPy des variations de prix movements, où chaque ligne correspond à une entreprise, ainsi qu'une liste des noms d'entreprises companies. Le regroupement hiérarchique de SciPy ne s'intègre pas dans un pipeline sklearn, vous devrez donc utiliser la fonction normalize() de sklearn.preprocessing plutôt que Normalizer.

linkage et dendrogram ont déjà été importés depuis scipy.cluster.hierarchy, et PyPlot a été importé sous le nom plt.

Instructions

100 XP
  • Importez normalize depuis sklearn.preprocessing.
  • Remettez à l'échelle les variations de prix pour chaque titre en utilisant la fonction normalize() sur movements.
  • Appliquez la fonction linkage() à normalized_movements, en utilisant la liaison 'complete', pour calculer le regroupement hiérarchique. Assignez le résultat à mergings.
  • Tracez un dendrogramme du regroupement hiérarchique en utilisant la liste companies des noms d'entreprises comme labels. Indiquez également les arguments nommés leaf_rotation=90 et leaf_font_size=6, comme vous l'avez fait dans l'Exercice précédent.