LoslegenKostenlos loslegen

Die erste Hauptkomponente

Die erste Hauptkomponente der Daten ist die Richtung, in der die Daten am stärksten variieren. In dieser Übung nutzt du PCA, um die erste Hauptkomponente der Längen- und Breitenmessungen der Getreideproben zu finden und sie als Pfeil im Streudiagramm darzustellen.

Das Array grains enthält die Länge und Breite der Getreideproben. PyPlot (plt) und PCA wurden bereits für dich importiert.

Diese Übung ist Teil des Kurses

Unsupervised Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein Streudiagramm der Getreidemessungen. Das wurde bereits für dich erledigt.
  • Erzeuge eine PCA-Instanz namens model.
  • Passe das Modell an die grains-Daten an.
  • Extrahiere die Koordinaten des Datenmittelwerts über das Attribut .mean_ von model.
  • Extrahiere die erste Hauptkomponente von model über das Attribut .components_[0,:].
  • Zeichne die erste Hauptkomponente als Pfeil im Streudiagramm mit der Funktion plt.arrow(). Du musst die ersten beiden Argumente angeben: mean[0] und mean[1].

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])

# Create a PCA instance: model
model = ____

# Fit model to points
____

# Get the mean of the grain samples: mean
mean = ____

# Get the first principal component: first_pc
first_pc = ____

# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)

# Keep axes on same scale
plt.axis('equal')
plt.show()
Code bearbeiten und ausführen