Comece agoraComece grátis

Variação dos recursos do site PCA

O conjunto de dados de peixes é 6-dimensional. Mas qual é sua dimensão intrínseca? Faça um gráfico das variações dos recursos do PCA para descobrir. Como antes, samples é uma matriz 2D, em que cada linha representa um peixe. Primeiro, você precisará padronizar os recursos.

Este exercicio faz parte do curso

Unsupervised Learning em Python

Ver curso

Instruções do exercicio

  • Crie uma instância do site StandardScaler chamada scaler.
  • Crie uma instância PCA chamada pca.
  • Use a função make_pipeline() para criar um pipeline que encadeie scaler e pca.
  • Use o método .fit() de pipeline para ajustá-lo às amostras de peixes samples.
  • Extraia o número de componentes usados usando o atributo .n_components_ de pca. Coloque isso em uma função range() e armazene o resultado como features.
  • Use a função plt.bar() para plotar as variâncias explicadas, com features no eixo x e pca.explained_variance_ no eixo y.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Editar e Executar Código