LoslegenKostenlos starten

Die erste Hauptkomponente

Die erste Hauptkomponente der Daten ist die Richtung, in der die Daten am stärksten variieren. In dieser Übung nutzt du PCA, um die erste Hauptkomponente der Längen- und Breitenmessungen der Getreideproben zu finden und sie als Pfeil im Streudiagramm darzustellen.

Das Array grains enthält die Länge und Breite der Getreideproben. PyPlot (plt) und PCA wurden bereits für dich importiert.

Diese Übung ist Teil des Kurses

<Kurs>Unsupervised Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle ein Streudiagramm der Getreidemessungen. Das wurde bereits für dich erledigt.
  • Erzeuge eine PCA-Instanz namens model.
  • Passe das Modell an die grains-Daten an.
  • Extrahiere die Koordinaten des Datenmittelwerts über das Attribut .mean_ von model.
  • Extrahiere die erste Hauptkomponente von model über das Attribut .components_[0,:].
  • Zeichne die erste Hauptkomponente als Pfeil im Streudiagramm mit der Funktion plt.arrow(). Du musst die ersten beiden Argumente angeben: mean[0] und mean[1].

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])

# Create a PCA instance: model
model = ____

# Fit model to points
____

# Get the mean of the grain samples: mean
mean = ____

# Get the first principal component: first_pc
first_pc = ____

# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)

# Keep axes on same scale
plt.axis('equal')
plt.show()
Code bearbeiten und ausführen