Erste SchritteKostenlos loslegen

Die erste Hauptkomponente

Die erste Hauptkomponente der Daten ist die Richtung, in der die Daten am stärksten variieren. In dieser Übung ist es deine Aufgabe, mit PCA die erste Hauptkomponente der Längen- und Breitenmessungen der Getreideproben zu finden und sie als Pfeil auf dem Streudiagramm darzustellen.

Das Feld grains gibt die Länge und Breite der Kornproben an. PyPlot (plt) und PCA sind bereits für dich importiert worden.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein Streudiagramm mit den Körnermessungen. Das haben wir für dich getan.
  • Erstelle eine PCA Instanz mit dem Namen model.
  • Passe das Modell an die Daten von grains an.
  • Extrahiere die Koordinaten des Mittelwerts der Daten mithilfe des Attributs .mean_ von model.
  • Erhalte die erste Hauptkomponente von model mit Hilfe des Attributs .components_[0,:].
  • Zeichne die erste Hauptkomponente als Pfeil in das Streudiagramm ein, indem du die Funktion plt.arrow() verwendest. Du musst die ersten beiden Argumente angeben - mean[0] und mean[1].

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])

# Create a PCA instance: model
model = ____

# Fit model to points
____

# Get the mean of the grain samples: mean
mean = ____

# Get the first principal component: first_pc
first_pc = ____

# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)

# Keep axes on same scale
plt.axis('equal')
plt.show()
Bearbeiten und Ausführen von Code