Varianz der PCA-Merkmale
Der Fisch-Datensatz hat sechs Dimensionen. Aber was ist dessen intrinsische Dimension? Erstelle ein Diagramm der Varianzen der PCA-Merkmale, um das herauszufinden. Wie zuvor ist samples ein 2D-Array, in dem jede Zeile einen Fisch darstellt. Du musst die Merkmale zuerst standardisieren.
Diese Übung ist Teil des Kurses
Unsupervised Learning in Python
Anleitung zur Übung
- Erstelle eine Instanz von
StandardScalernamensscaler. - Erstelle eine
PCA-Instanz namenspca. - Verwende die Funktion
make_pipeline(), um eine Pipeline ausscalerundpcazu verketten. - Verwende die
.fit()-Methode vonpipeline, um sie an die Fisch-Stichprobesamplesanzupassen. - Ermittle die Anzahl der verwendeten Komponenten über das Attribut
.n_components_vonpca. Setze das in einerange()-Funktion ein und speichere das Ergebnis alsfeatures. - Verwende die Funktion
plt.bar(), um die erklärten Varianzen zu plotten – mitfeaturesauf der x-Achse undpca.explained_variance_auf der y-Achse.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()