Varianz der PCA-Merkmale
Der Fisch-Datensatz hat 6 Dimensionen. Aber was ist eigentlich die eigentliche Bedeutung davon? Zeichne die Abweichungen der PCA-Merkmale auf, um das rauszufinden. Wie vorher ist „ samples
“ ein 2D-Array, wo jede Zeile einen Fisch darstellt. Du musst erst mal die Funktionen standardisieren.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Erstelle eine Instanz von
StandardScaler
mit dem Namenscaler
. - Erstell eine Instanz namens „
PCA
” mit dem Namen „pca
”. - Verwende die Funktion „
make_pipeline()
“, um eine Pipeline-Verknüpfung zu erstellen:scaler
undpca
. - Verwende die Methode „
.fit()
” aus „pipeline
”, um sie an die Fischproben anzupassen:samples
. - Hol die Anzahl der verwendeten Komponenten mit dem Attribut „
.n_components_
” von „pca
” raus. Schreib das in eine Funktion namens „range()
“ und speicher das Ergebnis als „features
“. - Verwende die Funktion „
plt.bar()
“, um die erklärten Varianzen zu zeichnen, mit „features
“ auf der x-Achse und „pca.explained_variance_
“ auf der y-Achse.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()