Visualiseer PC's met een screeplot
Tijdens een Machine Learning-sollicitatie kan je worden gevraagd wat het optimale aantal te behouden features is. In deze oefening maak je een screeplot en een cumulatieve verklaarde-variantieverhouding van de principale componenten met PCA op loan_data.
Dit helpt je bepalen hoeveel PC’s optimaal zijn om straks een nauwkeuriger ML-model te trainen.
Omdat PCA een unsupervised methode is, voer je de principalecomponentenanalyse uit op de X-matrix, waarbij je de doelvariabele Loan Status uit de gegevensset hebt verwijderd. Als je n_components niet instelt, krijg je alle principale componenten uit het getrainde model terug.
Deze oefening maakt deel uit van de cursus
Machine Learning-sollicitatievragen oefenen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Remove target variable
X = loan_data.____('____', axis=1)
# Instantiate
pca = ____(n_components=____)
# Fit and transform
principalComponents = pca.____(____)