Variantie van de PCA-features
De vissen-gegevensset is 6-dimensionaal. Maar wat is de intrinsieke dimensie? Maak een plot van de varianties van de PCA-features om dat te ontdekken. Zoals eerder is samples een 2D-array, waarbij elke rij een vis voorstelt. Je moet de features eerst standaardiseren.
Deze oefening maakt deel uit van de cursus
Unsupervised Learning in Python
Oefeninstructies
- Maak een instantie van
StandardScalermet de naamscaler. - Maak een
PCA-instantie met de naampca. - Gebruik de functie
make_pipeline()om een pipeline te maken diescalerenpcaaan elkaar schakelt. - Gebruik de methode
.fit()vanpipelineom deze te fitten op de vis-samplessamples. - Haal het aantal gebruikte componenten op met het attribuut
.n_components_vanpca. Plaats dit in eenrange()-functie en sla het resultaat op alsfeatures. - Gebruik de functie
plt.bar()om de verklaarde varianties te plotten, metfeaturesop de x-as enpca.explained_variance_op de y-as.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()