Variação dos recursos do site PCA
O conjunto de dados de peixes é 6-dimensional. Mas qual é sua dimensão intrínseca? Faça um gráfico das variações dos recursos do PCA para descobrir. Como antes, samples
é uma matriz 2D, em que cada linha representa um peixe. Primeiro, você precisará padronizar os recursos.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções de exercício
- Crie uma instância do site
StandardScaler
chamadascaler
. - Crie uma instância
PCA
chamadapca
. - Use a função
make_pipeline()
para criar um pipeline que encadeiescaler
epca
. - Use o método
.fit()
depipeline
para ajustá-lo às amostras de peixessamples
. - Extraia o número de componentes usados usando o atributo
.n_components_
depca
. Coloque isso em uma funçãorange()
e armazene o resultado comofeatures
. - Use a função
plt.bar()
para plotar as variâncias explicadas, comfeatures
no eixo x epca.explained_variance_
no eixo y.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()