LoslegenKostenlos loslegen

Varianz der PCA-Merkmale

Der Fisch-Datensatz hat sechs Dimensionen. Aber was ist dessen intrinsische Dimension? Erstelle ein Diagramm der Varianzen der PCA-Merkmale, um das herauszufinden. Wie zuvor ist samples ein 2D-Array, in dem jede Zeile einen Fisch darstellt. Du musst die Merkmale zuerst standardisieren.

Diese Übung ist Teil des Kurses

Unsupervised Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Instanz von StandardScaler namens scaler.
  • Erstelle eine PCA-Instanz namens pca.
  • Verwende die Funktion make_pipeline(), um eine Pipeline aus scaler und pca zu verketten.
  • Verwende die .fit()-Methode von pipeline, um sie an die Fisch-Stichprobe samples anzupassen.
  • Ermittle die Anzahl der verwendeten Komponenten über das Attribut .n_components_ von pca. Setze das in eine range()-Funktion ein und speichere das Ergebnis als features.
  • Verwende die Funktion plt.bar(), um die erklärten Varianzen zu plotten – mit features auf der x-Achse und pca.explained_variance_ auf der y-Achse.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Code bearbeiten und ausführen