CommencerCommencer gratuitement

Variance des caractéristiques PCA

L'ensemble de données sur les poissons est à 6 dimensions. Mais quelle est sa dimension intrinsèque? Pour le déterminer, veuillez créer un graphique représentant les variances des caractéristiques de l'ACP. Comme précédemment, samples est un tableau 2D, où chaque ligne représente un poisson. Vous devrez d'abord normaliser les fonctionnalités.

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Veuillez créer une instance d'StandardScaler nommée scaler.
  • Veuillez créer une instance d'PCA nommée « pca ».
  • Veuillez utiliser la fonction « make_pipeline() » pour créer une chaîne de pipelines scaler et pca.
  • Veuillez utiliser la méthode d'.fit() de pipeline pour l'ajuster aux échantillons de poissons samples.
  • Extrayez le nombre de composants utilisés à l'aide de l'attribut « .n_components_ » de l'pca. Veuillez placer ceci à l'intérieur d'une fonction d'range() et enregistrer le résultat sous le nom features.
  • Utilisez la fonction « plt.bar() » (graphique) pour représenter graphiquement les variances expliquées, avec l'features sur l'axe des x et l'pca.explained_variance_ sur l'axe des y.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Modifier et exécuter le code