ComeçarComece de graça

Variação das características da PCA

O conjunto de dados sobre peixes tem 6 dimensões. Mas qual é a dimensão real disso? Faça um gráfico das variações das características da PCA para descobrir. Como antes, “ samples ” é uma matriz 2D, onde cada linha representa um peixe. Você vai precisar padronizar os recursos primeiro.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Crie uma instância de StandardScaler chamada scaler.
  • Crie uma instância do PCA chamada pca.
  • Use a função “ make_pipeline() ” para criar um encadeamento de pipeline scaler e pca.
  • Use o método “ .fit() ” de pipeline para ajustá-lo às amostras de peixes samples.
  • Pega o número de componentes usados usando o atributo “ .n_components_ ” de “ pca ”. Coloque isso dentro de uma função “ range() ” e guarde o resultado como “ features ”.
  • Use a função “ plt.bar() ” para plotar as variações explicadas, com “ features ” no eixo x e “ pca.explained_variance_ ” no eixo y.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Editar e executar o código