Varianz der PCA Merkmale
Der Fisch-Datensatz ist 6-dimensional. Aber was ist seine eigentliche Dimension? Stelle die Varianzen der PCA Merkmale dar, um sie herauszufinden. Wie zuvor ist samples
ein 2D-Array, in dem jede Zeile einen Fisch darstellt. Du musst zuerst die Funktionen standardisieren.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Erstelle eine Instanz von
StandardScaler
mit dem Namenscaler
. - Erstelle eine
PCA
Instanz mit dem Namenpca
. - Verwende die Funktion
make_pipeline()
, um eine Pipeline zu erstellen, diescaler
undpca
verkettet. - Verwende die Methode
.fit()
vonpipeline
, um sie an die Fischprobensamples
anzupassen. - Extrahiere die Anzahl der verwendeten Komponenten mit Hilfe des
.n_components_
Attributs vonpca
. Platziere dies innerhalb einerrange()
Funktion und speichere das Ergebnis alsfeatures
. - Verwende die Funktion
plt.bar()
, um die erklärten Varianzen darzustellen, wobeifeatures
auf der x-Achse undpca.explained_variance_
auf der y-Achse liegt.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()