Die erste Hauptkomponente
Die erste Hauptkomponente der Daten ist die Richtung, in der die Daten am stärksten variieren. In dieser Übung nutzt du PCA, um die erste Hauptkomponente der Längen- und Breitenmessungen der Getreideproben zu finden und sie als Pfeil im Streudiagramm darzustellen.
Das Array grains enthält die Länge und Breite der Getreideproben. PyPlot (plt) und PCA wurden bereits für dich importiert.
Diese Übung ist Teil des Kurses
Unsupervised Learning in Python
Anleitung zur Übung
- Erstelle ein Streudiagramm der Getreidemessungen. Das wurde bereits für dich erledigt.
- Erzeuge eine
PCA-Instanz namensmodel. - Passe das Modell an die
grains-Daten an. - Extrahiere die Koordinaten des Datenmittelwerts über das Attribut
.mean_vonmodel. - Extrahiere die erste Hauptkomponente von
modelüber das Attribut.components_[0,:]. - Zeichne die erste Hauptkomponente als Pfeil im Streudiagramm mit der Funktion
plt.arrow(). Du musst die ersten beiden Argumente angeben:mean[0]undmean[1].
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])
# Create a PCA instance: model
model = ____
# Fit model to points
____
# Get the mean of the grain samples: mean
mean = ____
# Get the first principal component: first_pc
first_pc = ____
# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)
# Keep axes on same scale
plt.axis('equal')
plt.show()