Variação dos recursos do site PCA
O conjunto de dados de peixes é 6-dimensional. Mas qual é sua dimensão intrínseca? Faça um gráfico das variações dos recursos do PCA para descobrir. Como antes, samples é uma matriz 2D, em que cada linha representa um peixe. Primeiro, você precisará padronizar os recursos.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Crie uma instância do site
StandardScalerchamadascaler. - Crie uma instância
PCAchamadapca. - Use a função
make_pipeline()para criar um pipeline que encadeiescalerepca. - Use o método
.fit()depipelinepara ajustá-lo às amostras de peixessamples. - Extraia o número de componentes usados usando o atributo
.n_components_depca. Coloque isso em uma funçãorange()e armazene o resultado comofeatures. - Use a função
plt.bar()para plotar as variâncias explicadas, comfeaturesno eixo x epca.explained_variance_no eixo y.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()