Varianza de las características PCA
El conjunto de datos de los peces es de 6 dimensiones. Pero, ¿cuál es su dimensión intrínseca? Haz un gráfico de las varianzas de las características PCA para averiguarlo. Como antes, samples es una matriz 2D, donde cada fila representa un pez. Primero tendrás que normalizar las características.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones del ejercicio
- Crea una instancia de la clase
StandardScalerdenominadoscaler. - Crea una instancia de
PCAllamadapca. - Utiliza la función
make_pipeline()para crear una canalización encadenandoscalerypca. - Utiliza el método
.fit()depipelinepara ajustarlo a las muestras de pecessamples. - Extrae el número de componentes utilizados utilizando el atributo
.n_components_depca. Coloca esto dentro de una funciónrange()y guarda el resultado comofeatures. - Utiliza la función
plt.bar()para trazar las varianzas explicadas, confeaturesen el eje x ypca.explained_variance_en el eje y.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()