Aan de slagGa gratis aan de slag

Visualiseer PC's met een screeplot

Tijdens een Machine Learning-sollicitatie kan je worden gevraagd wat het optimale aantal te behouden features is. In deze oefening maak je een screeplot en een cumulatieve verklaarde-variantieverhouding van de principale componenten met PCA op loan_data. Dit helpt je bepalen hoeveel PC’s optimaal zijn om straks een nauwkeuriger ML-model te trainen.

Omdat PCA een unsupervised methode is, voer je de principalecomponentenanalyse uit op de X-matrix, waarbij je de doelvariabele Loan Status uit de gegevensset hebt verwijderd. Als je n_components niet instelt, krijg je alle principale componenten uit het getrainde model terug.

Deze oefening maakt deel uit van de cursus

Machine Learning-sollicitatievragen oefenen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Remove target variable
X = loan_data.____('____', axis=1)

# Instantiate
pca = ____(n_components=____)

# Fit and transform
principalComponents = pca.____(____)
Code bewerken en uitvoeren