Die erste Hauptkomponente
Die erste Hauptkomponente der Daten ist die Richtung, in der die Daten am meisten variieren. In dieser Übung musst du PCA nutzen, um die erste Hauptkomponente der Längen- und Breitenmessungen der Kornproben zu finden und sie als Pfeil im Streudiagramm darstellen.
Das Array „ grains
“ gibt die Länge und Breite der Kornproben an. PyPlot (plt
) und PCA
wurden schon für dich importiert.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Mach ein Streudiagramm von den Getreidemessungen. Das haben wir für dich getan.
- Erstell eine Instanz namens „
PCA
” mit dem Namen „model
”. - Passe das Modell an die Daten „
grains
“ an. - Hol die Koordinaten des Mittelwerts der Daten raus, indem du das Attribut „
.mean_
“ von „model
“ benutzt. - Hol die erste Hauptkomponente von „
model
“ mit dem Attribut „.components_[0,:]
“. - Zeichne die erste Hauptkomponente als Pfeil im Streudiagramm mit der Funktion „
plt.arrow()
“. Du musst die ersten beiden Argumente angeben –mean[0]
undmean[1]
.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])
# Create a PCA instance: model
model = ____
# Fit model to points
____
# Get the mean of the grain samples: mean
mean = ____
# Get the first principal component: first_pc
first_pc = ____
# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)
# Keep axes on same scale
plt.axis('equal')
plt.show()