Variance des caractéristiques PCA
L'ensemble de données sur les poissons est à 6 dimensions. Mais quelle est sa dimension intrinsèque? Pour le déterminer, veuillez créer un graphique représentant les variances des caractéristiques de l'ACP. Comme précédemment, samples
est un tableau 2D, où chaque ligne représente un poisson. Vous devrez d'abord normaliser les fonctionnalités.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Veuillez créer une instance d'
StandardScaler
nomméescaler
. - Veuillez créer une instance d'
PCA
nommée «pca
». - Veuillez utiliser la fonction «
make_pipeline()
» pour créer une chaîne de pipelinesscaler
etpca
. - Veuillez utiliser la méthode d'
.fit()
depipeline
pour l'ajuster aux échantillons de poissonssamples
. - Extrayez le nombre de composants utilisés à l'aide de l'attribut «
.n_components_
» de l'pca
. Veuillez placer ceci à l'intérieur d'une fonction d'range()
et enregistrer le résultat sous le nomfeatures
. - Utilisez la fonction «
plt.bar()
» (graphique) pour représenter graphiquement les variances expliquées, avec l'features
sur l'axe des x et l'pca.explained_variance_
sur l'axe des y.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()