Aan de slagGa gratis aan de slag

Variantie van de PCA-features

De vissen-gegevensset is 6-dimensionaal. Maar wat is de intrinsieke dimensie? Maak een plot van de varianties van de PCA-features om dat te ontdekken. Zoals eerder is samples een 2D-array, waarbij elke rij een vis voorstelt. Je moet de features eerst standaardiseren.

Deze oefening maakt deel uit van de cursus

Unsupervised Learning in Python

Cursus bekijken

Oefeninstructies

  • Maak een instantie van StandardScaler met de naam scaler.
  • Maak een PCA-instantie met de naam pca.
  • Gebruik de functie make_pipeline() om een pipeline te maken die scaler en pca aan elkaar schakelt.
  • Gebruik de methode .fit() van pipeline om deze te fitten op de vis-samples samples.
  • Haal het aantal gebruikte componenten op met het attribuut .n_components_ van pca. Plaats dit in een range()-functie en sla het resultaat op als features.
  • Gebruik de functie plt.bar() om de verklaarde varianties te plotten, met features op de x-as en pca.explained_variance_ op de y-as.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Code bewerken en uitvoeren