LoslegenKostenlos loslegen

Varianz der PCA Merkmale

Der Fisch-Datensatz ist 6-dimensional. Aber was ist seine eigentliche Dimension? Stelle die Varianzen der PCA Merkmale dar, um sie herauszufinden. Wie zuvor ist samples ein 2D-Array, in dem jede Zeile einen Fisch darstellt. Du musst zuerst die Funktionen standardisieren.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Instanz von StandardScaler mit dem Namen scaler.
  • Erstelle eine PCA Instanz mit dem Namen pca.
  • Verwende die Funktion make_pipeline(), um eine Pipeline zu erstellen, die scaler und pca verkettet.
  • Verwende die Methode .fit() von pipeline, um sie an die Fischproben samples anzupassen.
  • Extrahiere die Anzahl der verwendeten Komponenten mit Hilfe des .n_components_ Attributs von pca. Platziere dies innerhalb einer range() Funktion und speichere das Ergebnis als features.
  • Verwende die Funktion plt.bar(), um die erklärten Varianzen darzustellen, wobei features auf der x-Achse und pca.explained_variance_ auf der y-Achse liegt.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Code bearbeiten und ausführen