PCA op een groter gegevensset
Je gaat nu PCA toepassen op een wat grotere ANSUR-datasample met 13 dimensies, opnieuw al ingeladen als ansur_df. Het gefitte model wordt in de volgende oefening gebruikt.
Omdat we de principal components zelf niet gebruiken, is er geen noodzaak om de data te transformeren; het is voldoende om pca op de data te fitten.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in Python
Oefeninstructies
- Maak de
scaleraan. - Standaardiseer de data.
- Maak de
PCA()-instance aan. - Fit deze op de gestandaardiseerde data.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
# Scale the data
scaler = ____
ansur_std = ____
# Apply PCA
pca = ____
pca.____