Variance des caractéristiques PCA
L'ensemble de données sur les poissons est à 6 dimensions. Mais quelle est sa dimension intrinsèque? Pour le déterminer, veuillez créer un graphique représentant les variances des caractéristiques de l'ACP. Comme précédemment, samples est un tableau 2D, où chaque ligne représente un poisson. Vous devrez d'abord normaliser les fonctionnalités.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Veuillez créer une instance d'
StandardScalernomméescaler. - Veuillez créer une instance d'
PCAnommée «pca». - Veuillez utiliser la fonction «
make_pipeline()» pour créer une chaîne de pipelinesscaleretpca. - Veuillez utiliser la méthode d'
.fit()depipelinepour l'ajuster aux échantillons de poissonssamples. - Extrayez le nombre de composants utilisés à l'aide de l'attribut «
.n_components_» de l'pca. Veuillez placer ceci à l'intérieur d'une fonction d'range()et enregistrer le résultat sous le nomfeatures. - Utilisez la fonction «
plt.bar()» (graphique) pour représenter graphiquement les variances expliquées, avec l'featuressur l'axe des x et l'pca.explained_variance_sur l'axe des y.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()