Aktien mit KMeans gruppieren
In dieser Übung gruppierst du Unternehmen anhand ihrer täglichen Aktienkursbewegungen (also der Differenz zwischen dem Schlusskurs und dem Eröffnungskurs an jedem Handelstag). Du bekommst ein NumPy-Array movements
mit den täglichen Kursbewegungen von 2010 bis 2015 (von Yahoo! Finanzen), wo jede Zeile ein Unternehmen und jede Spalte einen Handelstag ist.
Einige Aktien sind teurer als andere. Um das zu berücksichtigen, füge am Anfang deiner Pipeline einen „ Normalizer
“ ein. Der Normalisierer wandelt die Aktienkurse jedes Unternehmens separat in eine relative Skala um, bevor die Clusterbildung beginnt.
Beachte, dass Normalizer()
anders ist als StandardScaler()
, das du in der letzten Übung benutzt hast. Während „ StandardScaler()
“ die Merkmale (wie die Merkmale der Fischdaten aus der vorherigen Übung) standardisiert, indem der Mittelwert entfernt und auf die Einheitsvarianz skaliert wird, skaliert „ Normalizer()
“ jede Probe – hier den Aktienkurs jedes Unternehmens – unabhängig von den anderen neu.
KMeans
und „ make_pipeline
“ wurden schon für dich importiert.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
Normalizer
aussklearn.preprocessing
. - Erstelle eine Instanz von
Normalizer
mit dem Namennormalizer
. - Erstell eine Instanz von „
KMeans
” mit dem Namen „kmeans
” und den folgenden Clustern: „10
”. - Erstell mit „
make_pipeline()
“ eine Pipeline namens „pipeline
“, die „normalizer
“ und „kmeans
“ verknüpft. - Passe die Pipeline an das Array „
movements
“ an.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import Normalizer
____
# Create a normalizer: normalizer
normalizer = ____
# Create a KMeans model with 10 clusters: kmeans
kmeans = ____
# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____
# Fit pipeline to the daily price movements
____