ComeçarComece gratuitamente

Variação dos recursos do site PCA

O conjunto de dados de peixes é 6-dimensional. Mas qual é sua dimensão intrínseca? Faça um gráfico das variações dos recursos do PCA para descobrir. Como antes, samples é uma matriz 2D, em que cada linha representa um peixe. Primeiro, você precisará padronizar os recursos.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver Curso

Instruções de exercício

  • Crie uma instância do site StandardScaler chamada scaler.
  • Crie uma instância PCA chamada pca.
  • Use a função make_pipeline() para criar um pipeline que encadeie scaler e pca.
  • Use o método .fit() de pipeline para ajustá-lo às amostras de peixes samples.
  • Extraia o número de componentes usados usando o atributo .n_components_ de pca. Coloque isso em uma função range() e armazene o resultado como features.
  • Use a função plt.bar() para plotar as variâncias explicadas, com features no eixo x e pca.explained_variance_ no eixo y.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Editar e executar código