Het aantal componenten kiezen
Je gaat nu een beter onderbouwde keuze maken voor het aantal hoofdcomponenten waarnaar je je data terugbrengt, met de techniek van de "knik in de grafiek". Voor de laatste keer werk je met de numerieke ANSUR-vrouwengegevensset die al is ingeladen als ansur_df.
Alle relevante pakketten en classes zijn alvast voor je ingeladen (Pipeline(), StandardScaler(), PCA()).
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Pipeline a scaler and PCA selecting 10 components
pipe = ____([('scaler', ____),
('reducer', ____)])