Decorrelación de las medidas de grano con PCA
En el ejercicio anterior has observado que las medidas de anchura y longitud del grano están correlacionadas. Ahora, utilizarás PCA para descorrelacionar estas medidas, luego trazarás los puntos descorrelacionados y medirás su correlación de Pearson.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones de ejercicio
- Importa
PCA
desdesklearn.decomposition
. - Crea una instancia de la clase
PCA
denominadomodel
. - Utiliza el método
.fit_transform()
demodel
para aplicar la transformación PCA agrains
. Asigna el resultado apca_features
. - El código posterior para extraer, trazar y calcular la correlación de Pearson de las dos primeras columnas
pca_features
se te proporciona escrito, ¡así que pulsa enviar para ver el resultado!
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import PCA
____
# Create PCA instance: model
model = ____
# Apply the fit_transform method of model to grains: pca_features
pca_features = ____
# Assign 0th column of pca_features: xs
xs = pca_features[:,0]
# Assign 1st column of pca_features: ys
ys = pca_features[:,1]
# Scatter plot xs vs ys
plt.scatter(xs, ys)
plt.axis('equal')
plt.show()
# Calculate the Pearson correlation of xs and ys
correlation, pvalue = pearsonr(xs, ys)
# Display the correlation
print(correlation)