LoslegenKostenlos loslegen

Varianz der PCA-Merkmale

Der Fisch-Datensatz hat 6 Dimensionen. Aber was ist eigentlich die eigentliche Bedeutung davon? Zeichne die Abweichungen der PCA-Merkmale auf, um das rauszufinden. Wie vorher ist „ samples “ ein 2D-Array, wo jede Zeile einen Fisch darstellt. Du musst erst mal die Funktionen standardisieren.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Instanz von StandardScaler mit dem Namen scaler.
  • Erstell eine Instanz namens „ PCA ” mit dem Namen „ pca ”.
  • Verwende die Funktion „ make_pipeline() “, um eine Pipeline-Verknüpfung zu erstellen: scaler und pca.
  • Verwende die Methode „ .fit() ” aus „ pipeline ”, um sie an die Fischproben anzupassen: samples.
  • Hol die Anzahl der verwendeten Komponenten mit dem Attribut „ .n_components_ ” von „ pca ” raus. Schreib das in eine Funktion namens „ range() “ und speicher das Ergebnis als „ features “.
  • Verwende die Funktion „ plt.bar() “, um die erklärten Varianzen zu zeichnen, mit „ features “ auf der x-Achse und „ pca.explained_variance_ “ auf der y-Achse.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Code bearbeiten und ausführen