PCs mit einem Scree-Plot visualisieren

In einem Machine-Learning-Interview kann die Frage auftauchen, wie viele Merkmale optimal beibehalten werden sollten. In dieser Übung erstellst du einen Scree-Plot und einen Plot der kumulativen erklärten Varianz der Hauptkomponenten mithilfe von PCA auf loan_data. Das hilft dir, die optimale Anzahl an PCs für das Training eines genaueren ML-Modells zu bestimmen.

Da PCA ein unüberwachtes Verfahren ist, wird die Hauptkomponentenanalyse auf der X-Matrix durchgeführt, nachdem die Zielvariable Loan Status aus dem Datensatz entfernt wurde. Wenn n_components nicht gesetzt wird, gibt das trainierte Modell alle Hauptkomponenten zurück.

Diese Übung ist Teil des Kurses

ML-Vorstellungsgespräche in Python üben

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Remove target variable
X = loan_data.____('____', axis=1)

# Instantiate
pca = ____(n_components=____)

# Fit and transform
principalComponents = pca.____(____)

Code bearbeiten und ausführen