O primeiro componente principal
A primeira componente principal dos dados é a direção em que os dados variam mais. Neste exercício, sua tarefa é usar a PCA para encontrar o primeiro componente principal das medidas de comprimento e largura das amostras de grãos e representá-lo como uma seta no gráfico de dispersão.
A matriz grains
mostra o comprimento e a largura das amostras de grãos. PyPlot (plt
) e PCA
já foram importados pra você.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Faça um gráfico de dispersão das medidas dos grãos. Isso foi feito para você.
- Crie uma instância do
PCA
chamadamodel
. - Ajuste o modelo aos dados
grains
. - Pega as coordenadas da média dos dados usando o atributo “
.mean_
” de “model
”. - Pega o primeiro componente principal de
model
usando o atributo.components_[0,:]
. - Plote o primeiro componente principal como uma seta no gráfico de dispersão, usando a função
plt.arrow()
. Você precisa colocar os dois primeiros argumentos -mean[0]
emean[1]
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])
# Create a PCA instance: model
model = ____
# Fit model to points
____
# Get the mean of the grain samples: mean
mean = ____
# Get the first principal component: first_pc
first_pc = ____
# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)
# Keep axes on same scale
plt.axis('equal')
plt.show()