Met PCA de korrelmetingen decorreleren
Je zag in de vorige oefening dat de breedte- en lengtemetingen van de korrel gecorreleerd zijn. Nu ga je PCA gebruiken om deze metingen te decorreleren, vervolgens de gedecorreleerde punten plotten en hun Pearson-correlatie berekenen.
Deze oefening maakt deel uit van de cursus
Unsupervised Learning in Python
Oefeninstructies
- Importeer
PCAuitsklearn.decomposition. - Maak een instantie van
PCAgenaamdmodel. - Gebruik de
.fit_transform()-methode vanmodelom de PCA-transformatie opgrainstoe te passen. Ken het resultaat toe aanpca_features. - De vervolgcode om de eerste twee kolommen van
pca_featureste extraheren, te plotten en de Pearson-correlatie te berekenen is al voor je geschreven, dus klik op Antwoord verzenden om het resultaat te zien!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import PCA
____
# Create PCA instance: model
model = ____
# Apply the fit_transform method of model to grains: pca_features
pca_features = ____
# Assign 0th column of pca_features: xs
xs = pca_features[:,0]
# Assign 1st column of pca_features: ys
ys = pca_features[:,1]
# Scatter plot xs vs ys
plt.scatter(xs, ys)
plt.axis('equal')
plt.show()
# Calculate the Pearson correlation of xs and ys
correlation, pvalue = pearsonr(xs, ys)
# Display the correlation
print(correlation)