PCs mit einem Scree-Plot visualisieren
In einem Machine-Learning-Interview kann die Frage auftauchen, wie viele Merkmale optimal beibehalten werden sollten. In dieser Übung erstellst du einen Scree-Plot und einen Plot der kumulativen erklärten Varianz der Hauptkomponenten mithilfe von PCA auf loan_data.
Das hilft dir, die optimale Anzahl an PCs für das Training eines genaueren ML-Modells zu bestimmen.
Da PCA ein unüberwachtes Verfahren ist, wird die Hauptkomponentenanalyse auf der X-Matrix durchgeführt, nachdem die Zielvariable Loan Status aus dem Datensatz entfernt wurde. Wenn n_components nicht gesetzt wird, gibt das trainierte Modell alle Hauptkomponenten zurück.
Diese Übung ist Teil des Kurses
<Kurs>ML-Vorstellungsgespräche in Python üben</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Remove target variable
X = loan_data.____('____', axis=1)
# Instantiate
pca = ____(n_components=____)
# Fit and transform
principalComponents = pca.____(____)