Variação das características da PCA
O conjunto de dados sobre peixes tem 6 dimensões. Mas qual é a dimensão real disso? Faça um gráfico das variações das características da PCA para descobrir. Como antes, “ samples ” é uma matriz 2D, onde cada linha representa um peixe. Você vai precisar padronizar os recursos primeiro.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Crie uma instância de
StandardScalerchamadascaler. - Crie uma instância do
PCAchamadapca. - Use a função “
make_pipeline()” para criar um encadeamento de pipelinescalerepca. - Use o método “
.fit()” depipelinepara ajustá-lo às amostras de peixessamples. - Pega o número de componentes usados usando o atributo “
.n_components_” de “pca”. Coloque isso dentro de uma função “range()” e guarde o resultado como “features”. - Use a função “
plt.bar()” para plotar as variações explicadas, com “features” no eixo x e “pca.explained_variance_” no eixo y.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()