Aktienhierarchien
In Kapitel 1 hast du k-means-Clustering benutzt, um Unternehmen nach ihren Aktienkursbewegungen zu gruppieren. Jetzt machst du ein hierarchisches Clustering der Firmen. Du bekommst ein NumPy-Array mit Kursbewegungen movements
, wobei die Zeilen den Unternehmen entsprechen, und eine Liste mit den Namen der Unternehmen companies
. Das hierarchische Clustering von SciPy passt nicht in eine sklearn-Pipeline, also musst du die Funktion „ normalize()
” von sklearn.preprocessing
anstelle von „ Normalizer
” verwenden.
linkage
dendrogram
wurden schon von scipy.cluster.hierarchy
importiert, und PyPlot wurde als plt
importiert.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
normalize
aussklearn.preprocessing
. - Skalier die Kursbewegungen für jede Aktie mit der Funktion „
normalize()
” aufmovements
. - Wende die Funktion „
linkage()
“ auf „normalized_movements
“ an und benutze dabei die Verknüpfung „'complete'
“, um das hierarchische Clustering zu berechnen. Weise das Ergebnismergings
zu. - Zeichne ein Dendrogramm der hierarchischen Clusterbildung, wobei du die Liste „
companies
“ mit den Firmennamen als „labels
“ verwendest. Gib außerdem die Schlüsselwortargumente „leaf_rotation=90
“ und „leaf_font_size=6
“ an, so wie du es in der letzten Übung gemacht hast.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import normalize
____
# Normalize the movements: normalized_movements
normalized_movements = ____
# Calculate the linkage: mergings
mergings = ____
# Plot the dendrogram
____
plt.show()