ComenzarEmpieza gratis

Varianza de las características PCA

El conjunto de datos de los peces es de 6 dimensiones. Pero, ¿cuál es su dimensión intrínseca? Haz un gráfico de las varianzas de los rasgos PCA para averiguarlo. Como antes, samples es una matriz 2D, donde cada fila representa un pez. Primero tendrás que normalizar las características.

Este ejercicio forma parte del curso

Aprendizaje no supervisado en Python

Ver curso

Instrucciones de ejercicio

  • Crea una instancia de la clase StandardScaler denominado scaler.
  • Crea una instancia de PCA llamada pca.
  • Utiliza la función make_pipeline() para crear una canalización encadenando scaler y pca.
  • Utiliza el método .fit() de pipeline para ajustarlo a las muestras de peces samples.
  • Extrae el número de componentes utilizados utilizando el atributo .n_components_ de pca. Coloca esto dentro de una función range() y guarda el resultado como features.
  • Utiliza la función plt.bar() para trazar las varianzas explicadas, con features en el eje x y pca.explained_variance_ en el eje y.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Editar y ejecutar código