Variance des caractéristiques PCA
L'ensemble de données sur les poissons est à 6 dimensions. Cependant, quelle est sa dimension intrinsèque ? Créez un graphique des variances des caractéristiques PCA pour le déterminer. Comme précédemment, samples est un tableau 2D, où chaque ligne représente un poisson. Il est nécessaire de normaliser les caractéristiques au préalable.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Créez une instance de
StandardScalerappeléescaler. - Créez une instance
PCAappeléepca. - Utilisez la fonction
make_pipeline()pour créer un pipeline enchaînantscaleretpca. - Utilisez la méthode
.fit()depipelinepour l'adapter aux échantillons de poissonssamples. - Extrayez le nombre de composants utilisés à l'aide de l'attribut
.n_components_depca. Placez-le dans une fonctionrange()et stockez le résultat sous le nomfeatures. - Utilisez la fonction
plt.bar()pour réaliser un graphique des variances expliquées, avecfeaturessur l'axe des x etpca.explained_variance_sur l'axe des y.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()