LoslegenKostenlos loslegen

Die erste Hauptkomponente

Die erste Hauptkomponente der Daten ist die Richtung, in der die Daten am meisten variieren. In dieser Übung musst du PCA nutzen, um die erste Hauptkomponente der Längen- und Breitenmessungen der Kornproben zu finden und sie als Pfeil im Streudiagramm darstellen.

Das Array „ grains “ gibt die Länge und Breite der Kornproben an. PyPlot (plt) und PCA wurden schon für dich importiert.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Mach ein Streudiagramm von den Getreidemessungen. Das haben wir für dich getan.
  • Erstell eine Instanz namens „ PCA ” mit dem Namen „ model ”.
  • Passe das Modell an die Daten „ grains “ an.
  • Hol die Koordinaten des Mittelwerts der Daten raus, indem du das Attribut „ .mean_ “ von „ model “ benutzt.
  • Hol die erste Hauptkomponente von „ model “ mit dem Attribut „ .components_[0,:] “.
  • Zeichne die erste Hauptkomponente als Pfeil im Streudiagramm mit der Funktion „ plt.arrow() “. Du musst die ersten beiden Argumente angeben – mean[0] und mean[1].

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])

# Create a PCA instance: model
model = ____

# Fit model to points
____

# Get the mean of the grain samples: mean
mean = ____

# Get the first principal component: first_pc
first_pc = ____

# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)

# Keep axes on same scale
plt.axis('equal')
plt.show()
Code bearbeiten und ausführen