ComeçarComece de graça

O primeiro componente principal

A primeira componente principal dos dados é a direção em que os dados variam mais. Neste exercício, sua tarefa é usar a PCA para encontrar o primeiro componente principal das medidas de comprimento e largura das amostras de grãos e representá-lo como uma seta no gráfico de dispersão.

A matriz grains mostra o comprimento e a largura das amostras de grãos. PyPlot (plt) e PCA já foram importados pra você.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Faça um gráfico de dispersão das medidas dos grãos. Isso foi feito para você.
  • Crie uma instância do PCA chamada model.
  • Ajuste o modelo aos dados grains.
  • Pega as coordenadas da média dos dados usando o atributo “ .mean_ ” de “ model ”.
  • Pega o primeiro componente principal de model usando o atributo .components_[0,:].
  • Plote o primeiro componente principal como uma seta no gráfico de dispersão, usando a função plt.arrow(). Você precisa colocar os dois primeiros argumentos - mean[0] e mean[1].

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])

# Create a PCA instance: model
model = ____

# Fit model to points
____

# Get the mean of the grain samples: mean
mean = ____

# Get the first principal component: first_pc
first_pc = ____

# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)

# Keep axes on same scale
plt.axis('equal')
plt.show()
Editar e executar o código