ComenzarEmpieza gratis

El primer componente principal

El primer componente principal de los datos es la dirección en la que los datos varían más. En este ejercicio, tu tarea consiste en utilizar el PCA para encontrar el primer componente principal de las mediciones de longitud y anchura de las muestras de grano, y representarlo como una flecha en el gráfico de dispersión.

La matriz grains da la longitud y la anchura de las muestras de grano. PyPlot (plt) y PCA ya se han importado para ti.

Este ejercicio forma parte del curso

Aprendizaje no supervisado en Python

Ver curso

Instrucciones del ejercicio

  • Haz un diagrama de dispersión de las medidas de los granos. Esto se te proporciona hecho.
  • Crea una instancia de PCA llamada model.
  • Ajusta el modelo a los datos grains.
  • Extrae las coordenadas de la media de los datos utilizando el atributo .mean_ de model.
  • Obtén el primer componente principal de model utilizando el atributo .components_[0,:].
  • Traza el primer componente principal como una flecha en el diagrama de dispersión, utilizando la función plt.arrow(). Tienes que especificar los dos primeros argumentos: mean[0] y mean[1].

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])

# Create a PCA instance: model
model = ____

# Fit model to points
____

# Get the mean of the grain samples: mean
mean = ____

# Get the first principal component: first_pc
first_pc = ____

# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)

# Keep axes on same scale
plt.axis('equal')
plt.show()
Editar y ejecutar código