CommencerCommencer gratuitement

Variance des caractéristiques PCA

L'ensemble de données sur les poissons est à 6 dimensions. Cependant, quelle est sa dimension intrinsèque ? Créez un graphique des variances des caractéristiques PCA pour le déterminer. Comme précédemment, samples est un tableau 2D, où chaque ligne représente un poisson. Il est nécessaire de normaliser les caractéristiques au préalable.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Créez une instance de StandardScaler appelée scaler.
  • Créez une instance PCA appelée pca.
  • Utilisez la fonction make_pipeline() pour créer un pipeline enchaînant scaler et pca.
  • Utilisez la méthode .fit() de pipeline pour l'adapter aux échantillons de poissons samples.
  • Extrayez le nombre de composants utilisés à l'aide de l'attribut .n_components_ de pca. Placez-le dans une fonction range() et stockez le résultat sous le nom features.
  • Utilisez la fonction plt.bar() pour réaliser un graphique des variances expliquées, avec features sur l'axe des x et pca.explained_variance_ sur l'axe des y.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Modifier et exécuter le code