Varianza de las características PCA
El conjunto de datos de los peces es de 6 dimensiones. Pero, ¿cuál es su dimensión intrínseca? Haz un gráfico de las varianzas de los rasgos PCA para averiguarlo. Como antes, samples
es una matriz 2D, donde cada fila representa un pez. Primero tendrás que normalizar las características.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones de ejercicio
- Crea una instancia de la clase
StandardScaler
denominadoscaler
. - Crea una instancia de
PCA
llamadapca
. - Utiliza la función
make_pipeline()
para crear una canalización encadenandoscaler
ypca
. - Utiliza el método
.fit()
depipeline
para ajustarlo a las muestras de pecessamples
. - Extrae el número de componentes utilizados utilizando el atributo
.n_components_
depca
. Coloca esto dentro de una funciónrange()
y guarda el resultado comofeatures
. - Utiliza la función
plt.bar()
para trazar las varianzas explicadas, confeatures
en el eje x ypca.explained_variance_
en el eje y.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()