Variação das características da PCA
O conjunto de dados sobre peixes tem 6 dimensões. Mas qual é a dimensão real disso? Faça um gráfico das variações das características da PCA para descobrir. Como antes, “ samples
” é uma matriz 2D, onde cada linha representa um peixe. Você vai precisar padronizar os recursos primeiro.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Crie uma instância de
StandardScaler
chamadascaler
. - Crie uma instância do
PCA
chamadapca
. - Use a função “
make_pipeline()
” para criar um encadeamento de pipelinescaler
epca
. - Use o método “
.fit()
” depipeline
para ajustá-lo às amostras de peixessamples
. - Pega o número de componentes usados usando o atributo “
.n_components_
” de “pca
”. Coloque isso dentro de uma função “range()
” e guarde o resultado como “features
”. - Use a função “
plt.bar()
” para plotar as variações explicadas, com “features
” no eixo x e “pca.explained_variance_
” no eixo y.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()