Die erste Hauptkomponente
Die erste Hauptkomponente der Daten ist die Richtung, in der die Daten am stärksten variieren. In dieser Übung ist es deine Aufgabe, mit PCA die erste Hauptkomponente der Längen- und Breitenmessungen der Getreideproben zu finden und sie als Pfeil auf dem Streudiagramm darzustellen.
Das Feld grains
gibt die Länge und Breite der Kornproben an. PyPlot (plt
) und PCA
sind bereits für dich importiert worden.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Erstelle ein Streudiagramm mit den Körnermessungen. Das haben wir für dich getan.
- Erstelle eine
PCA
Instanz mit dem Namenmodel
. - Passe das Modell an die Daten von
grains
an. - Extrahiere die Koordinaten des Mittelwerts der Daten mithilfe des Attributs
.mean_
vonmodel
. - Erhalte die erste Hauptkomponente von
model
mit Hilfe des Attributs.components_[0,:]
. - Zeichne die erste Hauptkomponente als Pfeil in das Streudiagramm ein, indem du die Funktion
plt.arrow()
verwendest. Du musst die ersten beiden Argumente angeben -mean[0]
undmean[1]
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])
# Create a PCA instance: model
model = ____
# Fit model to points
____
# Get the mean of the grain samples: mean
mean = ____
# Get the first principal component: first_pc
first_pc = ____
# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)
# Keep axes on same scale
plt.axis('equal')
plt.show()