LoslegenKostenlos loslegen

Aktien mit KMeans clustern

In dieser Übung clusterst du Unternehmen anhand ihrer täglichen Aktienkursbewegungen (also der Differenz in US‑Dollar zwischen Schluss- und Eröffnungskurs für jeden Handelstag). Du erhältst ein NumPy-Array namens movements mit täglichen Kursbewegungen von 2010 bis 2015 (aus Yahoo! Finance). Jede Zeile entspricht einem Unternehmen, jede Spalte einem Handelstag.

Einige Aktien sind teurer als andere. Um das zu berücksichtigen, füge am Anfang deiner Pipeline einen Normalizer hinzu. Der Normalizer skaliert die Aktienkurse jedes Unternehmens vor dem Clustering separat auf eine relative Skala.

Beachte, dass Normalizer() sich von StandardScaler() unterscheidet, den du in der vorherigen Übung verwendet hast. Während StandardScaler() Merkmale (wie die Merkmale der Fischdaten aus der vorherigen Übung) standardisiert, indem er den Mittelwert entfernt und auf die Varianz 1 skaliert, skaliert Normalizer() jede Probe – hier die Aktienkurse eines einzelnen Unternehmens – unabhängig von den anderen.

KMeans und make_pipeline wurden bereits für dich importiert.

Diese Übung ist Teil des Kurses

Unsupervised Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere Normalizer aus sklearn.preprocessing.
  • Erstelle eine Instanz von Normalizer namens normalizer.
  • Erstelle eine Instanz von KMeans namens kmeans mit 10 Clustern.
  • Erzeuge mit make_pipeline() eine Pipeline namens pipeline, die normalizer und kmeans verknüpft.
  • Fitte die Pipeline auf das Array movements.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import Normalizer
____

# Create a normalizer: normalizer
normalizer = ____

# Create a KMeans model with 10 clusters: kmeans
kmeans = ____

# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____

# Fit pipeline to the daily price movements
____
Code bearbeiten und ausführen